MoE大模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

蚂蚁集团推出两款 MoE 大模型，用国产芯片训练成本显著降低

3月24日，蚂蚁集团Ling团队发布两版MoE大模型——百灵轻量版（168亿参数）和增强版（2900亿参数）。团队提出创新方法，在低性能国产GPU上高效训练大模型，显著降低成本。实验显示，使用优化后的策略，3000亿参数模型在低规格硬件上的训练成本降至508万元，较传统方式节省近20%。该成果突破了高性能GPU依赖，提升了大模型在资源受限环境中的应用潜力。此前，DeepSeek通过类似努力降低了训练成本。蚂蚁集团的技术或将推动国产芯片在大模型领域的广泛应用，减少对英伟达芯片的依赖。

原文链接