1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:国产之光DeepSeek惊艳亮相,671B大模型训练仅需此前算力1/10,细节全公开

DeepSeek V3正式发布,延续“便宜大碗”的特点且完全开源。该模型参数量达671B,激活37B,在14.8T高质量token上预训练。在多项测评中,DeepSeek V3超越Llama 3.1 405B,与GPT-4o、Claude 3.5 Sonnet等模型匹敌,价格仅为Claude 3.5 Sonnet的9%。

DeepSeek V3训练耗时不到280万个GPU小时,而Llama 3 405B需3080万GPU小时。训练671B的DeepSeek V3成本为557.6万美元,而7B的Llama 2需76万美元。OpenAI创始成员Karpathy称赞其在有限算力下训练效率高,Meta科学家田渊栋惊叹其为“黑科技”。

新模型生成速度提升3倍,API价格大幅降低。DeepSeek V3在实测中表现优异,准确回答了关于自身版本的问题,超越其他模型。此外,DeepSeek V3支持FP8权重和BF16推理,现已开放使用。

贾扬清透露,DeepSeek团队早在2019年就具备相关技术,成就源于多年专业知识。

原文链接
本文链接:https://kx.umi6.com/article/10847.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
刚刚,让谷歌翻身的Gemini 3,上线Flash版
2025-12-18 11:42:39
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
谷歌 Gemini 3.0 Pro 旗舰 AI 模型内测流出:编程实力亮眼,下周上线
2025-10-03 15:41:08
DeepSeek官方点赞元宝,罕见现身互动
2025-12-24 17:46:41
谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明
2026-01-20 13:05:54
谷歌最强 AI 模型 Gemini 3 正式登场:发布即登顶 LMArena,号称迄今最智能
2025-11-19 08:02:25
deepseek当选网易有道词典2025年度词汇,全年搜索量超867万次
2025-12-01 18:22:41
德银:Anthropic不会是软件行业的“终结者”
2026-02-26 15:15:30
AI 模型加速创意呈现 华硕RTX50显卡为创作添彩!
2026-03-25 17:45:59
AI实盘操作,DeepSeek暴赚,Gemini崩盘,网友:专业对口就是不一样
2025-10-20 21:13:47
OpenAI据悉完成了新AI模型的初步开发
2026-03-25 04:57:32
AI大佬Karpathy焦虑了:作为程序员,我从未感到如此落后
2025-12-29 15:29:17
梁文锋,Nature全球年度十大科学人物!
2025-12-09 10:25:17
24小时热文
更多
扫一扫体验小程序