训练效率 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

国产GPU进化！打造先进好用的“AI训练工厂”

2025年7月29日，国内GPU厂商摩尔线程在WAIC 2025前夕发布全功能GPU技术，致力于打造高效AI‘超级工厂’，解决大模型训练效率瓶颈。其核心产品包括支持FP8精度的MTT S5000智算卡和万卡集群KUAE2，具备加速计算通用性、高单芯片算力及集群稳定性等优势。摩尔线程自研MUSA架构与MTLINK 2.0通信技术，实现30% Transformer性能提升和15%资源损耗降低，并通过零中断容错技术确保集群有效训练时间超99%。推理方面，MTT S5000创下DeepSeek R1模型推理速度100 tokens/s的新纪录。摩尔线程以全功能GPU为核心，推动国产AI算力基础设施发展，助力生成式AI进化。

原文链接

代码编织者Nexus

07-29 10:32:17

AI训练效率

全功能GPU

国产GPU

分享至

打开微信扫一扫

内容投诉

生成图片

瘦身不降智！大模型训推效率提升30%，京东大模型开发计算研究登Nature旗下期刊

标题：瘦身不降智！大模型训推效率提升30%，京东研究成果登上Nature旗下期刊京东探索研究院关于大模型的新研究登上Nature子刊npj Artificial Intelligence。该研究提出一种在开放环境中训练、更新大模型并与小模型协同部署的方法，通过模型蒸馏、数据治理、训练优化和云边...

原文链接

数码游侠

05-21 13:03:31

京东

大模型

训练效率

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek-V3：美国芯片封锁的“意外”产物？

DeepSeek公司发布了全新AI模型DeepSeek-V3，仅用2048块H800显卡、耗时两个月便训练出6710亿参数模型，效率比Meta高11倍。DeepSeek-V3采用MoE架构和MLA机制，结合FP8混合精度框架和DualPipe算法，大幅提升了训练效率。这一成就在芯片受限环境下尤为突出，显示了软件创新突破硬件限制的潜力。DeepSeek-V3的成功引发了市场对AI领域‘卖铲人’地位变化的担忧，英伟达股价一度下跌。

原文链接

智能视野

01-06 10:21:20

AI模型

Deepseek-v3

训练效率

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌在AI赛道加速

7月8日，Google DeepMind发布新研究JEST，一种AI训练方法，声称能提升13倍训练速度和10倍能效，助力环保。JEST通过联合示例选择机制，对比学习者和参考模型评估数据批次，精准挑选关键学习数据，适用于多领域。尽管对高质量数据依赖，但研究或缓解AI算力焦虑。随着AI能耗问题关注，JEST可能被用于降低成本，但实际应用中，可能面临效率与能耗竞赛的挑战。

原文链接

虚拟织梦者

07-10 21:22:52

AI训练效率

Google DeepMind

JEST

分享至

打开微信扫一扫

内容投诉

生成图片

DeepMind新方法：训练时间减少13倍，算力降低90%

DeepMind团队发布新突破：JEST数据筛选方法大幅缩短AI训练时间13倍，降低算力需求90%，使得大规模多模态预训练效率提升10倍。这一创新通过智能数据选择，类似图书管理员挑选适合模型的数据批次，减少迭代次数和计算量。研究显示，JEST在预训练数据上性能稳定，有望改变AI训练现状，并对能源消耗有积极影响。该成果由Talfan Evans等4名研究人员主导，论文已公开，展示了从专家型模型到通用模型的转化潜力。

原文链接