DeepSeek低调推出DeepSeek-V3-0324,被称为“小版本迭代”,但实测表现远超预期。该模型在代码生成、前端开发方面显著提升,部分能力比肩Claude 3.7 Sonnet,引发热议。
在KCORES测试中,DeepSeek-V3-0324代码能力达328.3分,超越普通版Claude 3.7 Sonnet(322.3分),接近其思维链版本(334.8分)。在Aider LLM Leaderboard中,其多语言基准得分55%,略低于R1,但在非推理模型中排名第二。
成本方面,DeepSeek-V3-0324表现极佳,仅为R1的约1/5。性能对比显示,Claude Sonnet 3.7 Thinking成本是其33倍,o1则高达167倍。用户可通过关闭“深度思考”选项使用新模型,Hugging Face也提供开源下载。
该模型包含685B参数,采用MoE架构,激活参数370亿,支持4-bit量化,运行流畅且磁盘占用仅352GB。前端开发表现尤为突出,媲美顶级商业模型。测试中,仅用简单提示词即可生成高质量代码。
在物理模拟和UI设计结合的测试中,DeepSeek-V3-0324生成的水分子交互模拟表现出色,温度滑块可动态调整分子运动。Reddit网友认为,其潜力源于强化学习技术的应用空间广阔。
整体来看,DeepSeek-V3-0324不仅技术指标逼近顶级商业AI,还以低成本和高自由度推动行业变革。此次更新可能预示R2的来临,全球AI竞争格局或迎新变局。
原文链接
本文链接:https://kx.umi6.com/article/16107.html
转载请注明文章出处
相关推荐
.png)
换一换
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
2025-08-11 13:01:00
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
中杯o3成OpenAI“性价比之王”?ARC-AGI测试结果出炉:得分翻倍、成本仅1/20
2025-04-23 11:51:39
阿里千问3下载量破千万!衍生模型数超13万稳居全球第一
2025-06-09 13:26:05
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025-07-11 11:34:58
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
昆仑万维发布并开源 Skywork-R1V 3.0,多模态推理能力逼近人类专家水平
2025-07-09 11:04:18
谷歌大模型“性价比之王”来了
2025-04-18 12:12:29
开源全能图像模型媲美GPT-4o!解决扩散模型误差累计问题
2025-05-12 16:35:41
字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式
2025-05-11 13:19:07
微软将 OpenAI 最小开源模型 gpt-oss-20b 引入 Windows,本地也能跑
2025-08-07 11:47:50
DeepSeek V3“小版本升级”实测堪比 V3.5,非推理模型也有“啊哈时刻”
2025-03-25 09:44:57
超越 OpenAI 医疗能力全球登顶,百川发布开源 AI 大模型 Baichuan-M2
2025-08-11 14:01:35
476 文章
168818 浏览
24小时热文
更多

-
2025-09-10 08:33:06
-
2025-09-10 08:32:11
-
2025-09-10 08:30:58