2025年9月,中国AI公司DeepSeek凭借其大模型R1首次登上《Nature》封面,成为首家获此殊荣的中国公司,创始人梁文锋为通讯作者。论文首次披露R1训练成本仅约29.4万美元(约合人民币208万),使用512张H800 GPU完成训练,参数规模达660B。评审专家称R1是首个经历同行评审的大型语言模型,影响力覆盖全球研究领域。截至发文,其谷歌学术引用达3596次,Hugging Face下载量超1090万次。DeepSeek还公开了数据来源、安全性评估等技术细节,并开源模型权重,推动社区发展。此次突破标志着中国AI研究迈向新高度,引发行业关注。
原文链接
本文链接:https://kx.umi6.com/article/25440.html
转载请注明文章出处
相关推荐
换一换
DeepSeek发布两款新模型
2025-12-01 19:31:03
DeepSeek流量下滑,这半年梁文锋都干了啥?
2025-07-14 14:22:04
梁文锋等来及时雨
2025-07-15 17:50:04
DeepSeek新论文剧透V4新框架!用闲置网卡加速智能体推理性能
2026-02-27 16:53:38
黄仁勋谈中国AI创新:以令人难以置信的速度前进
2025-07-16 17:12:34
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
DeepSeek母公司去年进账50亿,够烧2380个R1
2026-01-13 16:43:30
DeepSeek降本秘诀曝光
2025-07-05 11:59:25
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
黄仁勋:DeepSeek、阿里、腾讯推动AI创新
2025-07-16 16:08:35
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
被AI「摩擦」的十天:一个普通人的上手记
2025-08-16 18:28:03
629 文章
433086 浏览
24小时热文
更多
-
2026-03-10 09:02:22 -
2026-03-10 09:01:12 -
2026-03-10 09:00:02