“开源王者”Llama4发布,让DeepSeek等竞品松了一口气。
4月5日,Meta推出了备受期待的Llama4系列开源模型,包含Llama 4 Scout、Llama 4 Maverick和即将发布的Llama 4 Behemoth,分别满足不同场景需求。Llama 4 Scout支持多模态任务且可在单张H100 GPU上运行;Llama 4 Maverick在编码和推理能力上接近GPT-4o和Gemini 2.0,参数量小于DeepSeek v3;Llama 4 Behemoth则是参数量达2880亿的“巨兽”模型。
Llama4的技术亮点包括首次采用MoE架构提升效率、早期融合策略实现多模态统一、支持超长上下文的iRoPE架构以及优化的后训练流程。尽管Behemoth尚未正式发布,Llama4的其他两款模型并未带来颠覆性突破。其创新点主要集中在原生多模态预训练、MetaP超参数优化技术和对注意力机制的改进。
相比以往,Llama4更注重紧跟行业趋势,而非引领潮流。一些技术细节如多模态融合、MoE架构调整及后训练流程虽有亮点,但并未显著超越竞争对手。此次发布也被视为Meta应对开源领域激烈竞争的一次尝试,尤其是面对DeepSeek等快速崛起的对手。
值得注意的是,Llama4的发布时间选在周末,引发业内对其避开潜在竞争压力的猜测。未来,Llama4能否凭借后续的Behemoth模型重新确立领先地位,仍是未知数。
原文链接
本文链接:https://kx.umi6.com/article/16761.html
转载请注明文章出处
相关推荐
.png)
换一换
一周六连发!昆仑万维将多模态AI卷到了新高度
2025-08-17 18:38:51
Meta「逆天」狂飙
2025-07-31 11:04:49
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
2025-07-27 18:00:02
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
2025-08-04 17:00:39
三名Meta新聘AI研究员相继离职
2025-08-27 20:10:25
硅谷巨头强强联手!谷歌与Meta达成100亿美元云计算合同
2025-08-22 10:52:34
腾讯混元 0.5B、1.8B、4B、7B模型发布
2025-08-04 16:02:12
科技巨头Meta重组AI团队 战略涵盖短期到长期全线任务
2025-08-20 03:07:39
AI领域大新闻!不光是重组团队 Meta被曝已暂停AI招聘
2025-08-21 11:34:26
微软将 OpenAI 最小开源模型 gpt-oss-20b 引入 Windows,本地也能跑
2025-08-07 11:47:50
亏损仍坚持投资 扎克伯格:未来没有AI眼镜你连认知都会落后!
2025-08-01 09:15:23
Meta 将允许求职者“开挂”:部分编程面试中可以使用 AI 助手
2025-07-30 18:50:32
Meta GenAI产品总监加入OpenAI
2025-08-27 21:08:35
515 文章
201105 浏览
24小时热文
更多

-
2025-09-06 16:37:17
-
2025-09-06 16:36:53
-
2025-09-06 16:36:08