1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

Llama 4发布:拥抱新架构与多模态融合

Meta发布了Llama 4系列,没有再强调参数量的绝对优势,而是推出了三款针对性的模型:Scout、Maverick和Behemoth。Scout(109B参数)适合单卡部署,支持长上下文任务;Maverick(400B参数)性能媲美GPT-4o,推理成本仅为后者十分之一;Behemoth(2T参数)专注于训练数据生成,不对外开放。

架构上,Llama 4全面转向MoE(混合专家),Scout采用16专家,Maverick则扩展至128专家,推理时仅激活两个专家模块。这种设计灵感源自DeepSeek,通过更高效的参数利用提升性能。

多模态能力显著升级,图像处理从外挂编码器转变为原生token集成,使图文一体化建模成为可能。Maverick在DocVQA、ChartQA等任务中超越GPT-4o,且成本更低。Scout虽为轻量级,但仍表现出色。

训练策略上,Behemoth聚焦于生成高质量训练数据,支持Scout和Maverick的迭代优化,而非单纯追求单一模型的极限性能。

Llama 4标志着Meta从单一模型竞争转向体系化布局,Scout负责应用落地,Maverick专注实际交付,Behemoth则奠定基础能力。这不仅是技术进步,更是行业发展方向的信号灯。

原文链接
本文链接:https://kx.umi6.com/article/16754.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
百度文心大模型 4.5 官宣 3 月 16 日发布,原生多模态、深度思考
2025-02-28 15:14:39
全球最大开源视频模型,现在也Created in China了,阶跃出品
2025-02-19 14:50:40
Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B
2025-04-10 13:47:48
匆匆发布的Llama4
2025-04-06 16:09:03
中国AI凭什么逆袭美国?
2025-06-26 13:58:23
多模态和Agent成为大厂AI的新赛点
2025-04-30 20:07:29
全球首个深度推理+多模态大模型“紫东太初”4.0发布
2025-09-19 13:13:31
文生视频模型为何迟迟没有“aha moment”?
2025-04-14 15:40:26
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
阶跃星辰CEO姜大昕:多模态是实现AGI的必经之路
2025-05-09 10:48:42
摸DeepSeek过河也得自身硬! 想开后的文小言,真香!
2025-03-31 17:40:22
DeepSeek有四点我蛮佩服
2025-01-25 15:58:57
24小时热文
更多
扫一扫体验小程序