综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月18日,DeepSeek的大型语言模型DeepSeek-R1研究成果登上国际顶尖期刊《Nature》封面。这款国产AI模型仅用30万美元训练成本,远低于行业水平,并在推理能力上取得突破性进展。研究团队通过纯强化学习技术,让模型自主学习推理,无需依赖人类标注数据,在数学竞赛AIME 2024中准确率达77.9%,超越人类平均水平和部分顶级模型如GPT-4的表现。论文经过严格同行评审,公开了详细的训练流程及数据,回应了关于“蒸馏”或抄袭其他模型的质疑。此次登顶Nature封面不仅是对DeepSeek的认可,也为AI模型科学化树立新标杆,呼吁更多企业接受学术评审。
原文链接
2025年9月,中国AI公司DeepSeek凭借其大模型R1首次登上《Nature》封面,成为首家获此殊荣的中国公司,创始人梁文锋为通讯作者。论文首次披露R1训练成本仅约29.4万美元(约合人民币208万),使用512张H800 GPU完成训练,参数规模达660B。评审专家称R1是首个经历同行评审的大型语言模型,影响力覆盖全球研究领域。截至发文,其谷歌学术引用达3596次,Hugging Face下载量超1090万次。DeepSeek还公开了数据来源、安全性评估等技术细节,并开源模型权重,推动社区发展。此次突破标志着中国AI研究迈向新高度,引发行业关注。
原文链接
加载更多
暂无内容