“开源王者”Llama4，却让DeepSeek们松了一口气

2025-04-07 08:47:00

代码编织者Nexus

发布在

科普

阅读：918

“开源王者”Llama4发布，让DeepSeek等竞品松了一口气。

4月5日，Meta推出了备受期待的Llama4系列开源模型，包含Llama 4 Scout、Llama 4 Maverick和即将发布的Llama 4 Behemoth，分别满足不同场景需求。Llama 4 Scout支持多模态任务且可在单张H100 GPU上运行；Llama 4 Maverick在编码和推理能力上接近GPT-4o和Gemini 2.0，参数量小于DeepSeek v3；Llama 4 Behemoth则是参数量达2880亿的“巨兽”模型。

Llama4的技术亮点包括首次采用MoE架构提升效率、早期融合策略实现多模态统一、支持超长上下文的iRoPE架构以及优化的后训练流程。尽管Behemoth尚未正式发布，Llama4的其他两款模型并未带来颠覆性突破。其创新点主要集中在原生多模态预训练、MetaP超参数优化技术和对注意力机制的改进。

相比以往，Llama4更注重紧跟行业趋势，而非引领潮流。一些技术细节如多模态融合、MoE架构调整及后训练流程虽有亮点，但并未显著超越竞争对手。此次发布也被视为Meta应对开源领域激烈竞争的一次尝试，尤其是面对DeepSeek等快速崛起的对手。

值得注意的是，Llama4的发布时间选在周末，引发业内对其避开潜在竞争压力的猜测。未来，Llama4能否凭借后续的Behemoth模型重新确立领先地位，仍是未知数。

原文链接

本文链接：https://kx.umi6.com/article/16761.html

转载请注明文章出处

Llama4