1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

“开源王者”Llama4发布,让DeepSeek等竞品松了一口气。

4月5日,Meta推出了备受期待的Llama4系列开源模型,包含Llama 4 Scout、Llama 4 Maverick和即将发布的Llama 4 Behemoth,分别满足不同场景需求。Llama 4 Scout支持多模态任务且可在单张H100 GPU上运行;Llama 4 Maverick在编码和推理能力上接近GPT-4o和Gemini 2.0,参数量小于DeepSeek v3;Llama 4 Behemoth则是参数量达2880亿的“巨兽”模型。

Llama4的技术亮点包括首次采用MoE架构提升效率、早期融合策略实现多模态统一、支持超长上下文的iRoPE架构以及优化的后训练流程。尽管Behemoth尚未正式发布,Llama4的其他两款模型并未带来颠覆性突破。其创新点主要集中在原生多模态预训练、MetaP超参数优化技术和对注意力机制的改进。

相比以往,Llama4更注重紧跟行业趋势,而非引领潮流。一些技术细节如多模态融合、MoE架构调整及后训练流程虽有亮点,但并未显著超越竞争对手。此次发布也被视为Meta应对开源领域激烈竞争的一次尝试,尤其是面对DeepSeek等快速崛起的对手。

值得注意的是,Llama4的发布时间选在周末,引发业内对其避开潜在竞争压力的猜测。未来,Llama4能否凭借后续的Behemoth模型重新确立领先地位,仍是未知数。

原文链接
本文链接:https://kx.umi6.com/article/16761.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
“AI争霸”格局大变:Alphabet被热捧Meta却坐冷板凳,为何?
2025-10-31 16:40:59
AI落后信号?Meta考虑采用谷歌Gemini技术进行广告定向投放
2025-09-26 12:28:16
Meta的新款AI眼镜获看好 华尔街投行纷纷唱多
2025-09-19 17:22:51
开源模型首次物理奥赛夺金!上海AI Lab 235B模型击败GPT5和Grok4
2025-10-25 15:29:19
Meta推出AI视频生成平台Vibes
2025-09-26 08:20:53
阿里开源全模态大模型Qwen3-Omni 可像人类一样听说写
2025-09-24 16:50:21
宇树:开源机器人世界大模型!
2025-09-16 13:11:33
华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开
2025-10-16 17:57:55
AI支出失控?Meta市值一夜蒸发逾1.5万亿 目标价遭投行密集下调
2025-10-31 09:27:19
Meta高薪挖人却留不住人?多位AI研究人员被爆已离职
2025-08-28 16:28:49
Meta和Scale AI闹翻!砸143亿买的高管跑路,业务也合作不下去
2025-09-01 15:17:44
坚信世界模型才是未来!Meta首席AI科学家杨立昆官宣将离职
2025-11-20 10:20:53
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
24小时热文
更多
扫一扫体验小程序