
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
3月24日,蚂蚁集团Ling团队发布两版MoE大模型——百灵轻量版(168亿参数)和增强版(2900亿参数)。团队提出创新方法,在低性能国产GPU上高效训练大模型,显著降低成本。实验显示,使用优化后的策略,3000亿参数模型在低规格硬件上的训练成本降至508万元,较传统方式节省近20%。该成果突破了高性能GPU依赖,提升了大模型在资源受限环境中的应用潜力。此前,DeepSeek通过类似努力降低了训练成本。蚂蚁集团的技术或将推动国产芯片在大模型领域的广泛应用,减少对英伟达芯片的依赖。
原文链接
加载更多

暂无内容