1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

DeepSeek V3,一个参数量达6710亿的AI模型,于近期正式开源。相比Llama 3.1 405B,DeepSeek V3不仅在评测中达到开源SOTA,还能与GPT-4o和Claude 3.5 Sonnet等顶级模型相媲美,且价格仅为后者的1/53。更令人惊叹的是,DeepSeek V3仅需不到280万个GPU小时的训练时间,相比Llama 3.1的3080万GPU小时,大幅降低了成本。DeepSeek V3的API价格也极具竞争力,每百万输入tokens只需0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。此外,DeepSeek V3支持FP8权重的原生开源,并提供FP8到BF16的转换脚本。DeepSeek团队的技术成就得到了多位专家的认可,包括OpenAI创始成员Karpathy和Meta科学家田渊栋。DeepSeek V3现已开放体验,官网为。

原文链接
本文链接:https://kx.umi6.com/article/10855.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
全球首个医疗视频理解大模型开源!6k+组精标测试集与英雄榜同步上线,开发者速来!
2026-04-26 14:16:11
阿里新一代模型Qwen3.5曝光
2026-02-09 13:10:49
低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!
2025-12-14 22:01:20
智谱开源GLM-OCR模型
2026-02-03 09:27:36
蚂蚁发布并开源万亿参数思考模型Ring-1T
2025-10-14 17:25:02
荣耀推出智能体基础模型MagicAgent 面向全球开源
2026-03-03 16:20:21
通义万相全新动作生成模型开源
2025-09-19 15:17:03
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
外滩大会今年太AI了!王坚暴论:OpenAI确实站在了历史错误的一边
2025-09-12 12:10:41
阶跃星辰全面开源 Step 3.5 Flash:预训练+训练框架全放出 冲上 OpenClaw Top2
2026-03-04 10:34:06
钉钉CLI开源 原生支持ClaudeCode、Cursor、Qoder等
2026-03-27 21:22:12
阿里千问开源Qwen3-Coder-Next模型
2026-02-04 08:31:48
24小时热文
更多
扫一扫体验小程序