2025年9月,中国AI公司DeepSeek凭借其大模型R1首次登上《Nature》封面,成为首家获此殊荣的中国公司,创始人梁文锋为通讯作者。论文首次披露R1训练成本仅约29.4万美元(约合人民币208万),使用512张H800 GPU完成训练,参数规模达660B。评审专家称R1是首个经历同行评审的大型语言模型,影响力覆盖全球研究领域。截至发文,其谷歌学术引用达3596次,Hugging Face下载量超1090万次。DeepSeek还公开了数据来源、安全性评估等技术细节,并开源模型权重,推动社区发展。此次突破标志着中国AI研究迈向新高度,引发行业关注。
原文链接
本文链接:https://kx.umi6.com/article/25440.html
转载请注明文章出处
相关推荐
换一换
DeepSeek真的不行了吗
2025-07-29 19:35:17
DeepSeek的一次小更新:暴打OpenAI 追上Gemini
2025-12-03 00:44:54
黄仁勋力赞DeepSeek 对中国创新能力充满信心
2025-07-21 04:12:05
报道称DeepSeek计划年底前发布AI智能体 公司暂无回应
2025-09-04 17:05:24
DeepSeek新模型上线
2025-09-30 11:25:43
AI味,越来越让人受不了了
2025-06-30 17:46:15
朱民:未来18个月 中国将出现超百项“DeepSeek式突破”
2025-06-26 17:25:26
人民呼唤DeepSeek!
2025-07-16 12:02:16
当DeepSeek都认为“DeepSeek向王一博道歉”了
2025-07-04 12:43:36
DeepSeek V3.1突现离谱Bug:“极”字满屏乱蹦,开发者一脸懵逼
2025-08-26 14:46:26
在史上最大规模WAIC中寻找DeepSeek
2025-07-28 09:10:59
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
555 文章
317035 浏览
24小时热文
更多
-
2025-12-08 18:41:52 -
2025-12-08 18:40:45 -
2025-12-08 18:40:02