DeepSeek低调推出DeepSeek-V3-0324,被称为“小版本迭代”,但实测表现远超预期。该模型在代码生成、前端开发方面显著提升,部分能力比肩Claude 3.7 Sonnet,引发热议。
在KCORES测试中,DeepSeek-V3-0324代码能力达328.3分,超越普通版Claude 3.7 Sonnet(322.3分),接近其思维链版本(334.8分)。在Aider LLM Leaderboard中,其多语言基准得分55%,略低于R1,但在非推理模型中排名第二。
成本方面,DeepSeek-V3-0324表现极佳,仅为R1的约1/5。性能对比显示,Claude Sonnet 3.7 Thinking成本是其33倍,o1则高达167倍。用户可通过关闭“深度思考”选项使用新模型,Hugging Face也提供开源下载。
该模型包含685B参数,采用MoE架构,激活参数370亿,支持4-bit量化,运行流畅且磁盘占用仅352GB。前端开发表现尤为突出,媲美顶级商业模型。测试中,仅用简单提示词即可生成高质量代码。
在物理模拟和UI设计结合的测试中,DeepSeek-V3-0324生成的水分子交互模拟表现出色,温度滑块可动态调整分子运动。Reddit网友认为,其潜力源于强化学习技术的应用空间广阔。
整体来看,DeepSeek-V3-0324不仅技术指标逼近顶级商业AI,还以低成本和高自由度推动行业变革。此次更新可能预示R2的来临,全球AI竞争格局或迎新变局。
原文链接
本文链接:https://kx.umi6.com/article/16107.html
转载请注明文章出处
相关推荐
.png)
换一换
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
2025-04-06 10:54:42
B站开源动漫视频生成模型 AniSora V3 版,速度更快、质量更高
2025-07-07 08:25:15
全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹
2024-12-16 13:35:14
409 文章
58163 浏览
24小时热文
更多

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13