DeepSeek低调宣称小更新，结果用2折价格达到R1水平

2025-03-25 17:07:03

Journeyman

发布在

科普

阅读：801

DeepSeek低调推出DeepSeek-V3-0324，被称为“小版本迭代”，但实测表现远超预期。该模型在代码生成、前端开发方面显著提升，部分能力比肩Claude 3.7 Sonnet，引发热议。

在KCORES测试中，DeepSeek-V3-0324代码能力达328.3分，超越普通版Claude 3.7 Sonnet（322.3分），接近其思维链版本（334.8分）。在Aider LLM Leaderboard中，其多语言基准得分55%，略低于R1，但在非推理模型中排名第二。

成本方面，DeepSeek-V3-0324表现极佳，仅为R1的约1/5。性能对比显示，Claude Sonnet 3.7 Thinking成本是其33倍，o1则高达167倍。用户可通过关闭“深度思考”选项使用新模型，Hugging Face也提供开源下载。

该模型包含685B参数，采用MoE架构，激活参数370亿，支持4-bit量化，运行流畅且磁盘占用仅352GB。前端开发表现尤为突出，媲美顶级商业模型。测试中，仅用简单提示词即可生成高质量代码。

在物理模拟和UI设计结合的测试中，DeepSeek-V3-0324生成的水分子交互模拟表现出色，温度滑块可动态调整分子运动。Reddit网友认为，其潜力源于强化学习技术的应用空间广阔。

整体来看，DeepSeek-V3-0324不仅技术指标逼近顶级商业AI，还以低成本和高自由度推动行业变革。此次更新可能预示R2的来临，全球AI竞争格局或迎新变局。

原文链接

本文链接：https://kx.umi6.com/article/16107.html

转载请注明文章出处

DeepSeek-V3-0324

开源模型

性价比

分享至

打开微信扫一扫

内容投诉

生成图片

Journeyman

685 文章

751182 浏览

24小时热文