1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

3月24日,蚂蚁集团就“百灵”大模型训练成本问题作出回应,表示已针对不同芯片持续优化,降低成本并计划逐步开源。此前,蚂蚁Ling团队在Arxiv平台发布论文,推出百灵轻量版(168亿参数)和增强版(2900亿参数)两款MoE大语言模型,采用创新方法实现在低性能硬件上的高效训练。实验显示,该3000亿参数模型在国产GPU设备上的表现与使用英伟达芯片的同类模型相当,显著降低了训练成本。

原文链接
本文链接:https://kx.umi6.com/article/16035.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
蚂蚁集团旗下公司等入股烨知芯科技 后者经营范围含集成电路芯片设计等
2025-09-03 14:50:33
Q2财报启示录:AI为大厂们带来了新「钱景」
2025-09-03 14:46:42
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
大模型产生幻觉 全怪人类PUA吗
2025-09-12 01:04:40
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
上海:推动医疗器械相关垂类大模型研发应用
2025-09-15 16:02:14
美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出
2025-09-01 11:16:10
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
大模型产生幻觉,全怪人类PUA吗?
2025-09-10 15:36:03
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
24小时热文
更多
扫一扫体验小程序