1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

蚂蚁集团自主研发了名为Ling-Lite和Ling-Plus的百灵系列开源MoE模型,参数规模分别为168亿和2900亿。相比GPT-4.5的1.8万亿参数和DeepSeek-R1的6710亿参数,蚂蚁团队通过国产AI芯片和创新技术显著降低了训练成本,仅需508万元人民币。这一成果已发表于Arxiv平台,标志着蚂蚁加入全球AI科技竞争。

蚂蚁Ling团队在模型训练中采用了异构计算架构,利用国产AI芯片完成训练,而非完全依赖英伟达H800等高端GPU。团队通过构建9万亿token语料库、优化MoE架构及训练策略,结合DLRover分布式框架、XPUTimer调试工具和EDiT弹性训练技术,大幅提升了训练效率。例如,使用低规格硬件将1万亿token预训练成本降至508万元,较高性能硬件节约近20%。

实验结果显示,Ling-Lite在英语基准测试中优于Meta的Llama 3.1-8B,Ling-Plus则在中文测试中超越DeepSeek系列模型。此外,Ling-Plus在安全性和错误拒绝率方面表现均衡,优于其他模型。蚂蚁计划开源这两款模型,并将其应用于医疗、金融等领域。

尽管训练过程充满挑战,蚂蚁团队克服了稳定性等问题,展现了中国在AI领域的创新能力。彭博分析师指出,这项成果表明中国正逐步实现AI技术的自主化,同时规避英伟达芯片出口限制带来的影响。

原文链接
本文链接:https://kx.umi6.com/article/16007.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中国信通院启动 AI 大模型幻觉评测,总体涉及五种测试维度
2025-03-19 17:41:04
蚂蚁集团副总裁、前基础大模型负责人徐鹏离职
2025-04-12 11:41:50
高考题,AI大模型不能解,也不敢解
2025-06-10 14:50:09
中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型
2025-04-07 09:48:23
AI大模型引爆银发经济:12万亿市场重构进行时
2025-03-21 11:19:20
蚂蚁集团回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
2025-03-24 17:06:03
Anthropic天价赔款?大模型“盗版”的100000种花样
2025-08-15 10:14:50
为什么说广告是AI大模型公司最现实的商业化选择?
2025-04-14 10:26:39
意言科技完成近千万元天使轮融资,徐汇科创投领投
2025-05-07 18:14:05
全网都在等梁文锋
2025-04-30 19:53:07
全球首个女性肿瘤 AI 大模型 “木兰”进入临床应用,手机端免费使用
2025-05-16 14:10:42
蚂蚁集团旗下OceanBase任命AI战略一号位
2025-04-27 14:17:47
斯坦福报告:中美顶级AI大模型性能差距缩至0.3%
2025-04-11 15:56:13
24小时热文
更多
扫一扫体验小程序