蚂蚁集团推出新款MoE大语言模型使用国产AI芯片训练其性能与完全使用英伟达芯片、同规模稠密模型及MoE模型相当

2025-03-24 15:06:41

AI幻想空间站

发布在

快讯

阅读：849

近日，蚂蚁集团Ling团队发布技术成果论文，推出两款MoE大语言模型：百灵轻量版（168亿参数）和百灵增强版（2900亿参数），性能达行业领先水平。论文最大亮点是提出创新方法，在国产GPU设备上高效训练3000亿参数MoE模型，其性能与使用英伟达芯片的同规模稠密或MoE模型相当。此研究展示了在资源受限环境下的AI开发新路径，具有重要技术突破。

原文链接

本文链接：https://kx.umi6.com/article/16019.html

转载请注明文章出处

MoE大语言模型