1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

蚂蚁国产GPU训练大模型细节曝光!Ling模型研发负责人回应

近日,蚂蚁一篇技术论文引发关注。论文中显示,他们推出的两款MoE大模型能在国产GPU上完成与英伟达同效的训练,计算成本甚至低于DeepSeek。对此,蚂蚁Ling模型研发负责人张志强在知乎上作出回应,分享了他们在大模型训练中的经验和教训。

张志强发布的长文《关于我们抠 FLOPS 的一些点滴》,详细介绍了他们在训练正确性对齐、Router TP(Tensor Parallelism)bug修复、训练稳定性等方面的努力。他还澄清了外界对于成本计算的误解,强调无论是在GPU还是国产加速卡上,LLM的训练成本优化都有无限潜力。

在正确性对齐方面,他们确保不同平台的训练结果一致,包括算子精度、框架一致性及loss差异控制。此外,团队解决了MindSpeed框架中router部分的收敛问题,修复了反向传播中的梯度重复问题。在NormHead迁移上,他们优化了多D并行下的实现,以提高国产加速卡上的计算效率。

针对国产加速卡稳定性不足的问题,团队设计了loss和grad尖刺处理机制,有效提升了训练的鲁棒性。成本计算上,他们采用学术界的通行方法,表明国产加速卡的训练成本与GPU相当甚至更低,同时保证loss收敛一致。

Ling模型的发布仅是第一步,未来团队将继续优化,包括探索FP8精度训练及强化学习等前沿技术。张志强表示,AGI必将来临,他们致力于让其惠及大众,期待未来的持续关注。

原文链接
本文链接:https://kx.umi6.com/article/16240.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Kimi春节档挣超一年钱!这口“龙虾肉”大厂开始抢吃了
2026-02-26 01:05:27
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
2026-02-05 08:39:59
2025最大赌注:为什么所有厂商都押宝AI手机?
2025-12-25 09:25:38
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1
2025-11-18 14:20:39
蚂蚁再把医疗AI卷出新高度!蚂蚁·安诊儿医疗大模型开源即SOTA
2026-01-09 20:33:03
腾讯AI下了一场「及时雨」
2025-12-19 10:42:16
Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5
2026-01-20 22:33:50
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
月之暗面近20天收入超去年全年
2026-02-23 19:11:04
汪军对话 Rich Sutton:大模型在一定程度上分散了我们对智能理解的注意力
2025-09-28 11:53:51
我国大模型密集落地 新技术加速普惠应用
2026-02-14 12:17:30
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
24小时热文
更多
扫一扫体验小程序