今天,国产开源模型DeepSeek-V3首个版本正式上线,参数达671B,已在14.8T token上预训练。该模型在多项评测中超越Qwen2.5-72B和Llama-3.1-405B,与Claude-3.5-Sonnet和GPT-4o性能相当。DeepSeek-V3在代码生成、数学能力等方面表现出色,生成速度提升至60 TPS,为用户带来更流畅体验。API服务价格调整为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),输出tokens 8元。优惠体验期至2025年2月8日,价格为每百万输入tokens 0.1元(缓存命中)/1元(缓存未命中),输出tokens 2元。模型权重已开源。
原文链接
本文链接:https://kx.umi6.com/article/10947.html
转载请注明文章出处
相关推荐
.png)
换一换
美国“SPAC之王”查马斯:公司已转用Kimi K2
2025-10-11 19:32:28
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
智谱 GLM-4.6 旗舰 AI 模型发布:代码能力全面进阶,适配寒武纪、摩尔线程芯片
2025-09-30 15:28:45
持续拥抱开源 腾讯混元一口气开源四款小尺寸模型 最小仅0.5B
2025-08-04 18:06:55
李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了
2025-04-08 15:58:38
首次披露!DeepSeek V3 发布软硬一体协同训练论文,公开“降成本”秘诀
2025-05-16 14:52:41
狼真的要来了!GPT-5准备抢走打工人的饭碗
2025-08-08 16:15:53
基础模型、开源旋风与浙江三剑客
2025-04-08 14:58:06
字节跳动开源长文本处理模型Seed-OSS-36B
2025-08-21 14:39:00
消息称智谱 GLM-4.5 今晚开源新模型,知情人士回应确有其事
2025-07-28 16:20:04
从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了
2025-04-01 13:24:13
GPT-5快抢走打工人饭碗了
2025-08-08 07:03:43
腾讯推出智能体开发平台并计划开源多个模型
2025-05-21 11:01:38
514 文章
238114 浏览
24小时热文
更多

-
2025-10-23 17:12:06
-
2025-10-23 17:10:54
-
2025-10-23 16:12:32