3月24日,蚂蚁集团就“百灵”大模型训练成本问题作出回应,表示已针对不同芯片持续优化,降低成本并计划逐步开源。此前,蚂蚁Ling团队在Arxiv平台发布论文,推出百灵轻量版(168亿参数)和增强版(2900亿参数)两款MoE大语言模型,采用创新方法实现在低性能硬件上的高效训练。实验显示,该3000亿参数模型在国产GPU设备上的表现与使用英伟达芯片的同类模型相当,显著降低了训练成本。
原文链接
本文链接:https://kx.umi6.com/article/16035.html
转载请注明文章出处
相关推荐
换一换
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
2025-12-21 10:35:20
中信建投通信及人工智能中期策略:大模型持续迭代 算力需求强劲增长
2026-05-13 09:05:16
智谱AI今日正式上市,一文讲透你想知道的6件事
2026-01-09 21:35:10
李开复任命三位新高管:零一万物的“一把手工程”与大模型中场战事
2025-10-27 13:00:52
蚂蚁开源万亿参数强化学习高性能权重交换框架Awex
2025-11-20 10:23:09
阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队
2026-02-27 15:48:37
智谱中标679.8万元水电大模型项目
2025-11-05 20:23:03
舔狗AI和被预约的寿司郎
2026-06-05 00:34:31
智谱、MiniMax争夺「大模型第一股」
2025-12-24 10:30:23
杭州蚂蚁投了家腾讯系具身智能公司
2025-11-23 23:26:16
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1
2025-11-18 14:20:39
建议你不要再相信AI基准测试,排行榜已经没啥公信力了
2025-12-04 12:18:33
刚刚,智谱港交所敲钟!市值528亿港元
2026-01-08 11:04:01
744 文章
650262 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41