昨夜,参数量6850亿的DeepSeek-V3新版本悄然而至。相比上一版参数量仅小幅增长,但代码与数学推理能力显著提升,甚至追平Claude 3.7。该模型采用MIT开源协议,支持自由修改与商业化应用,且能在消费级设备如Mac上高效运行。网友实测显示,V3在编码、数学及逻辑推理等方面表现亮眼,部分测试中甚至超越Claude 3.7。DeepSeek团队延续低调风格,未提前宣传便直接上线,引发行业震动。有预测称,DeepSeek-R2或几周内发布,可能直接对标GPT-5。开源模型的崛起正加速全球AI格局变化,中国AI企业正逐步缩小与美国的技术差距。
原文链接
本文链接:https://kx.umi6.com/article/18133.html
转载请注明文章出处
相关推荐
.png)
换一换
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
2025-07-30 12:43:45
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
2025-08-12 14:22:32
首次披露!DeepSeek V3 发布软硬一体协同训练论文,公开“降成本”秘诀
2025-05-16 14:52:41
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
昆仑万维发布并开源Matrix-Game 2.0模型
2025-08-12 10:17:03
小红书开源首个大模型 预训练未使用合成数据
2025-06-10 09:46:30
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
小扎自曝挖人秘诀:小团队我亲自带,豪掷数百亿建GW集群,大家不图天价薪酬只为“造神”
2025-07-15 13:42:34
百度正式开源文心大模型 4.5 系列模型
2025-06-30 11:41:55
开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文
2025-07-23 09:45:56
给Manus七分钟,它可以做什么
2025-05-19 22:24:28
京东云开源JoyAgent智能体
2025-07-26 10:36:52
548 文章
249985 浏览
24小时热文
更多

-
2025-10-23 17:12:06
-
2025-10-23 17:10:54
-
2025-10-23 16:12:32