1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

“开源王者”Llama4发布,让DeepSeek等竞品松了一口气。

4月5日,Meta推出了备受期待的Llama4系列开源模型,包含Llama 4 Scout、Llama 4 Maverick和即将发布的Llama 4 Behemoth,分别满足不同场景需求。Llama 4 Scout支持多模态任务且可在单张H100 GPU上运行;Llama 4 Maverick在编码和推理能力上接近GPT-4o和Gemini 2.0,参数量小于DeepSeek v3;Llama 4 Behemoth则是参数量达2880亿的“巨兽”模型。

Llama4的技术亮点包括首次采用MoE架构提升效率、早期融合策略实现多模态统一、支持超长上下文的iRoPE架构以及优化的后训练流程。尽管Behemoth尚未正式发布,Llama4的其他两款模型并未带来颠覆性突破。其创新点主要集中在原生多模态预训练、MetaP超参数优化技术和对注意力机制的改进。

相比以往,Llama4更注重紧跟行业趋势,而非引领潮流。一些技术细节如多模态融合、MoE架构调整及后训练流程虽有亮点,但并未显著超越竞争对手。此次发布也被视为Meta应对开源领域激烈竞争的一次尝试,尤其是面对DeepSeek等快速崛起的对手。

值得注意的是,Llama4的发布时间选在周末,引发业内对其避开潜在竞争压力的猜测。未来,Llama4能否凭借后续的Behemoth模型重新确立领先地位,仍是未知数。

原文链接
本文链接:https://kx.umi6.com/article/16761.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Meta 扩大员工使用竞争对手 AI 工具权限,含 ChatGPT-5、 Gemini 3 Pro 等
2025-12-17 13:42:35
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
10 万亿 tokens!英伟达贡献全球最大规模开源数据集,并推四大开源 AI 模型
2026-01-06 06:48:15
可玩转千余款游戏,英伟达联合斯坦福等研发 NitroGen 开源模型
2025-12-21 11:38:39
Meta 收购 Manus 细节曝光,开价 20 亿美元闪电成交
2025-12-31 16:29:56
LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局
2026-01-04 14:07:29
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!
2026-01-08 19:25:43
从视频一键提取某个声音:Meta 发布 SAM Audio,多模态音频分离新突破
2025-12-18 00:10:29
Meta 被指 AI 生成广告泛滥,多名英国消费者称花高价买到“假英国品牌”
2025-11-29 16:23:36
Kimi K2 Thinking突袭!智能体&推理能力超GPT-5,网友:再次缩小开源闭源差距
2025-11-07 10:43:45
Meta计划进军电力交易市场
2025-11-24 15:07:03
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
2026-01-12 16:41:44
最强Coding Plan上线!阿里云上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型
2026-02-25 13:16:58
24小时热文
更多
扫一扫体验小程序