标题:瘦身不降智!大模型训推效率提升30%,京东研究成果登上Nature旗下期刊
京东探索研究院关于大模型的新研究登上Nature子刊npj Artificial Intelligence。该研究提出一种在开放环境中训练、更新大模型并与小模型协同部署的方法,通过模型蒸馏、数据治理、训练优化和云边协同四大创新,使推理效率平均提升30%,训练成本降低70%。
论文介绍了一种名为《Omniforce:以人为中心的、赋能大模型的、云边协同的自动机器学习系统》的项目,解决了开放环境下大模型开发效率的难题。
具体创新包括:
- 模型蒸馏:采用动态分层技术,大幅减少资源消耗,降低部署成本。
- 数据治理:跨领域数据动态采样结合隐私保护与主动学习,提升模型泛化能力。
- 训练优化:贝叶斯优化框架提高资源利用率,尤其在离散空间表现优异。
- 云边协同:云端负责训练,边缘设备负责推理,提升协作效率。
实验表明,该平台支持多种模型蒸馏与推理,效果显著。JoyBuild平台为企业提供定制化解决方案,助力通用模型向专业模型转化,大幅缩短开发周期,降低人力与成本。
京东还结合自身业务场景,加速大模型商业化落地,为各行业提供普惠性技术支持。这一成果为大模型应用提供了普适路径,推动AI技术更广泛应用。
原文链接
本文链接:https://kx.umi6.com/article/18960.html
转载请注明文章出处
相关推荐
换一换
Karpathy 最新发文:别把 AI 当人看,它没欲望也不怕死
2025-11-22 19:29:36
卓世科技,股改完成!
2026-01-05 15:08:15
豆包大模型2.0正式发布
2026-02-14 14:23:01
从 CIPS & CLM 迈进:中国大模型的智能跃迁
2025-10-30 17:51:34
美团内测万亿级新一代大模型,全程基于国产算力集群训练
2026-04-24 12:12:33
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
2025-12-21 10:35:20
百度推动大模型与搜推业务融合
2026-03-18 15:35:09
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1
2025-11-18 14:20:39
我国大模型密集落地 新技术加速普惠应用
2026-02-14 12:17:30
刚刚,智谱港交所敲钟!市值528亿港元
2026-01-08 11:04:01
独家|百度成立模型委员会(BMC) 加强人工智能技术优势
2026-05-15 10:39:37
731 文章
651477 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08