“开源王者”Llama4发布,让DeepSeek等竞品松了一口气。
4月5日,Meta推出了备受期待的Llama4系列开源模型,包含Llama 4 Scout、Llama 4 Maverick和即将发布的Llama 4 Behemoth,分别满足不同场景需求。Llama 4 Scout支持多模态任务且可在单张H100 GPU上运行;Llama 4 Maverick在编码和推理能力上接近GPT-4o和Gemini 2.0,参数量小于DeepSeek v3;Llama 4 Behemoth则是参数量达2880亿的“巨兽”模型。
Llama4的技术亮点包括首次采用MoE架构提升效率、早期融合策略实现多模态统一、支持超长上下文的iRoPE架构以及优化的后训练流程。尽管Behemoth尚未正式发布,Llama4的其他两款模型并未带来颠覆性突破。其创新点主要集中在原生多模态预训练、MetaP超参数优化技术和对注意力机制的改进。
相比以往,Llama4更注重紧跟行业趋势,而非引领潮流。一些技术细节如多模态融合、MoE架构调整及后训练流程虽有亮点,但并未显著超越竞争对手。此次发布也被视为Meta应对开源领域激烈竞争的一次尝试,尤其是面对DeepSeek等快速崛起的对手。
值得注意的是,Llama4的发布时间选在周末,引发业内对其避开潜在竞争压力的猜测。未来,Llama4能否凭借后续的Behemoth模型重新确立领先地位,仍是未知数。
原文链接
本文链接:https://kx.umi6.com/article/16761.html
转载请注明文章出处
相关推荐
换一换
开源新标杆!商汤 SenseNova-MARS超 Gemini-3-Pro,模型代码数据全开放
2026-01-30 11:22:29
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
Meta:计划在未来五年内 向AI公司Nebius投入高达270亿美元
2026-03-16 18:22:48
AI 科学家杨立昆离职后曝 Meta 模型作弊刷榜
2026-01-04 14:07:44
Meta 全新 AI 模型“牛油果”开发内幕:消息称扎克伯格亲自抓,阿里 Qwen 模型参与蒸馏
2025-12-11 00:15:55
Meta元宇宙部门狂裁千人
2026-01-16 15:40:05
最强Coding Plan上线!阿里云上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型
2026-02-25 13:16:58
Meta可能在明年初推出新AI大模型Avocado
2025-12-09 22:02:45
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude
2026-03-09 12:34:15
Meta高管回应AI泡沫质疑:如今繁荣看似激进 但并未失控
2025-11-16 19:48:26
Meta全力转向闭源模型 新模型Avocado或于明年春季推出
2025-12-10 23:15:05
可玩转千余款游戏,英伟达联合斯坦福等研发 NitroGen 开源模型
2025-12-21 11:38:39
Meta 大逃杀!扎克伯格「地狱模式」曝光,不拼命搞 AI 就滚蛋
2025-12-28 13:26:10
729 文章
621884 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17