蚂蚁集团回应新模型训练成本降低：基于不同芯片持续调优，会逐步开源

2025-03-24 17:06:03

智能视野

发布在

快讯

阅读：626

3月24日，蚂蚁集团就“百灵”大模型训练成本问题作出回应，表示已针对不同芯片持续优化，降低成本并计划逐步开源。此前，蚂蚁Ling团队在Arxiv平台发布论文，推出百灵轻量版（168亿参数）和增强版（2900亿参数）两款MoE大语言模型，采用创新方法实现在低性能硬件上的高效训练。实验显示，该3000亿参数模型在国产GPU设备上的表现与使用英伟达芯片的同类模型相当，显著降低了训练成本。

原文链接

本文链接：https://kx.umi6.com/article/16035.html

转载请注明文章出处

大模型