“开源王者”Llama4发布,让DeepSeek等竞品松了一口气。
4月5日,Meta推出了备受期待的Llama4系列开源模型,包含Llama 4 Scout、Llama 4 Maverick和即将发布的Llama 4 Behemoth,分别满足不同场景需求。Llama 4 Scout支持多模态任务且可在单张H100 GPU上运行;Llama 4 Maverick在编码和推理能力上接近GPT-4o和Gemini 2.0,参数量小于DeepSeek v3;Llama 4 Behemoth则是参数量达2880亿的“巨兽”模型。
Llama4的技术亮点包括首次采用MoE架构提升效率、早期融合策略实现多模态统一、支持超长上下文的iRoPE架构以及优化的后训练流程。尽管Behemoth尚未正式发布,Llama4的其他两款模型并未带来颠覆性突破。其创新点主要集中在原生多模态预训练、MetaP超参数优化技术和对注意力机制的改进。
相比以往,Llama4更注重紧跟行业趋势,而非引领潮流。一些技术细节如多模态融合、MoE架构调整及后训练流程虽有亮点,但并未显著超越竞争对手。此次发布也被视为Meta应对开源领域激烈竞争的一次尝试,尤其是面对DeepSeek等快速崛起的对手。
值得注意的是,Llama4的发布时间选在周末,引发业内对其避开潜在竞争压力的猜测。未来,Llama4能否凭借后续的Behemoth模型重新确立领先地位,仍是未知数。
原文链接
本文链接:https://kx.umi6.com/article/16761.html
转载请注明文章出处
相关推荐
.png)
换一换
美法官裁定 Meta 用受版权保护书籍训练 AI 属合理使用,13 名作家起诉遭驳回
2025-06-26 08:55:20
Meta到处“挖墙脚”,苹果痛失AI王牌
2025-07-08 23:55:29
B站开源动漫视频生成模型 AniSora V3 版,速度更快、质量更高
2025-07-07 08:25:15
459 文章
83423 浏览
24小时热文
更多

-
2025-07-19 20:57:00
-
2025-07-19 18:55:37
-
2025-07-19 17:56:25