DeepSeek低调推出DeepSeek-V3-0324,被称为“小版本迭代”,但实测表现远超预期。该模型在代码生成、前端开发方面显著提升,部分能力比肩Claude 3.7 Sonnet,引发热议。
在KCORES测试中,DeepSeek-V3-0324代码能力达328.3分,超越普通版Claude 3.7 Sonnet(322.3分),接近其思维链版本(334.8分)。在Aider LLM Leaderboard中,其多语言基准得分55%,略低于R1,但在非推理模型中排名第二。
成本方面,DeepSeek-V3-0324表现极佳,仅为R1的约1/5。性能对比显示,Claude Sonnet 3.7 Thinking成本是其33倍,o1则高达167倍。用户可通过关闭“深度思考”选项使用新模型,Hugging Face也提供开源下载。
该模型包含685B参数,采用MoE架构,激活参数370亿,支持4-bit量化,运行流畅且磁盘占用仅352GB。前端开发表现尤为突出,媲美顶级商业模型。测试中,仅用简单提示词即可生成高质量代码。
在物理模拟和UI设计结合的测试中,DeepSeek-V3-0324生成的水分子交互模拟表现出色,温度滑块可动态调整分子运动。Reddit网友认为,其潜力源于强化学习技术的应用空间广阔。
整体来看,DeepSeek-V3-0324不仅技术指标逼近顶级商业AI,还以低成本和高自由度推动行业变革。此次更新可能预示R2的来临,全球AI竞争格局或迎新变局。
原文链接
本文链接:https://kx.umi6.com/article/16107.html
转载请注明文章出处
相关推荐
换一换
HuggingChat Omni 集成式 AI 平台发布,可针对用户指令从百款开源模型库中挑选最适合回答
2025-10-18 10:30:57
在史上最大规模WAIC中寻找DeepSeek
2025-07-28 09:10:59
AI出海,掘金一个时代
2026-02-07 10:06:40
OpenAI 推出两款开源模型 gpt-oss-120b / 20b,性能逼近 o4-mini/o3-mini
2025-08-06 08:23:05
AI Agent的门票 MiniMax想先打下来
2026-06-04 17:17:31
宇树:开源机器人世界大模型!
2025-09-16 13:11:33
老黄入局吃龙虾!英伟达发布最强开源Agent推理模型
2026-03-12 13:36:30
中国AI开源模型下载量占比首次超过美国
2025-11-27 18:49:55
对话朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
2025-09-20 20:35:10
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
AI 人像以假乱真,阿里通义 Qwen-Image-2512 模型开源发布
2025-12-31 18:33:39
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
Kimi K2.5发布24小时登顶全球开源榜单
2026-01-28 20:37:16
678 文章
600336 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08