“开源王者”Llama4发布,让DeepSeek等竞品松了一口气。
4月5日,Meta推出了备受期待的Llama4系列开源模型,包含Llama 4 Scout、Llama 4 Maverick和即将发布的Llama 4 Behemoth,分别满足不同场景需求。Llama 4 Scout支持多模态任务且可在单张H100 GPU上运行;Llama 4 Maverick在编码和推理能力上接近GPT-4o和Gemini 2.0,参数量小于DeepSeek v3;Llama 4 Behemoth则是参数量达2880亿的“巨兽”模型。
Llama4的技术亮点包括首次采用MoE架构提升效率、早期融合策略实现多模态统一、支持超长上下文的iRoPE架构以及优化的后训练流程。尽管Behemoth尚未正式发布,Llama4的其他两款模型并未带来颠覆性突破。其创新点主要集中在原生多模态预训练、MetaP超参数优化技术和对注意力机制的改进。
相比以往,Llama4更注重紧跟行业趋势,而非引领潮流。一些技术细节如多模态融合、MoE架构调整及后训练流程虽有亮点,但并未显著超越竞争对手。此次发布也被视为Meta应对开源领域激烈竞争的一次尝试,尤其是面对DeepSeek等快速崛起的对手。
值得注意的是,Llama4的发布时间选在周末,引发业内对其避开潜在竞争压力的猜测。未来,Llama4能否凭借后续的Behemoth模型重新确立领先地位,仍是未知数。
原文链接
本文链接:https://kx.umi6.com/article/16761.html
转载请注明文章出处
相关推荐
换一换
倪光南院士:报告显示 80% 的美国 AI 创新企业使用中国开源模型
2025-11-14 11:53:25
AI眼镜热度不减 Meta最新产品卖断货 CTO称销售点数量将翻番
2025-10-05 12:18:57
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
Kimi K2 Thinking突袭!智能体&推理能力超GPT-5,网友:再次缩小开源闭源差距
2025-11-07 10:43:45
大模型年终观察,如何定义2025年的「好模型」?
2025-12-22 21:00:44
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
美国“SPAC之王”查马斯:公司已转用Kimi K2
2025-10-11 19:32:28
谷歌前 CEO 施密特:大多数国家最终可能使用中国的 AI 模型
2025-11-12 16:13:53
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
小甜甜变牛夫人,消息称扎克伯格将削减至多三成 Meta 元宇宙项目预算
2025-12-04 22:49:46
Meta使用阿里千问优化其最新AI模型
2025-12-11 00:19:01
95后小伙手搓AI眼镜:盲道、红绿灯都可认出 成本仅百元
2025-10-24 12:39:22
Meta与Blue Owl Capital合作开展270亿美元AI数据中心项目
2025-10-22 08:45:48
665 文章
469846 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44