1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

蚂蚁国产GPU训练大模型细节曝光!Ling模型研发负责人回应

近日,蚂蚁一篇技术论文引发关注。论文中显示,他们推出的两款MoE大模型能在国产GPU上完成与英伟达同效的训练,计算成本甚至低于DeepSeek。对此,蚂蚁Ling模型研发负责人张志强在知乎上作出回应,分享了他们在大模型训练中的经验和教训。

张志强发布的长文《关于我们抠 FLOPS 的一些点滴》,详细介绍了他们在训练正确性对齐、Router TP(Tensor Parallelism)bug修复、训练稳定性等方面的努力。他还澄清了外界对于成本计算的误解,强调无论是在GPU还是国产加速卡上,LLM的训练成本优化都有无限潜力。

在正确性对齐方面,他们确保不同平台的训练结果一致,包括算子精度、框架一致性及loss差异控制。此外,团队解决了MindSpeed框架中router部分的收敛问题,修复了反向传播中的梯度重复问题。在NormHead迁移上,他们优化了多D并行下的实现,以提高国产加速卡上的计算效率。

针对国产加速卡稳定性不足的问题,团队设计了loss和grad尖刺处理机制,有效提升了训练的鲁棒性。成本计算上,他们采用学术界的通行方法,表明国产加速卡的训练成本与GPU相当甚至更低,同时保证loss收敛一致。

Ling模型的发布仅是第一步,未来团队将继续优化,包括探索FP8精度训练及强化学习等前沿技术。张志强表示,AGI必将来临,他们致力于让其惠及大众,期待未来的持续关注。

原文链接
本文链接:https://kx.umi6.com/article/16240.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队
2026-02-27 15:48:37
中国AI云,开始「抢座次」了
2025-11-20 11:17:00
智谱首份业绩报告:商业化全面爆发,Maas平台ARR达17亿元提升60倍
2026-03-31 18:02:15
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
市值3055亿!摩尔线程敲钟,国产通用GPU第一股来了
2025-12-05 12:24:49
「中国英伟达」不好当
2025-12-26 17:53:02
ToC智能体火得快,但更大的价值在企业丨中关村科金@MEET2026
2025-12-12 14:53:17
全球大模型第一股要来了 智谱发布IPO招股书:代码能力并列全球第一
2025-12-19 23:17:39
独家|百度成立模型委员会(BMC) 加强人工智能技术优势
2026-05-15 10:39:37
2025最大赌注:为什么所有厂商都押宝AI手机?
2025-12-25 09:25:38
Gartner首次发布大模型报告:火山引擎排名中国厂商第一
2025-11-20 12:17:36
中信建投:持续推荐AI算力板块
2025-10-28 08:39:40
Manus救不了Meta
2026-01-08 20:35:12
24小时热文
更多
扫一扫体验小程序