昨夜,参数量6850亿的DeepSeek-V3新版本悄然而至。相比上一版参数量仅小幅增长,但代码与数学推理能力显著提升,甚至追平Claude 3.7。该模型采用MIT开源协议,支持自由修改与商业化应用,且能在消费级设备如Mac上高效运行。网友实测显示,V3在编码、数学及逻辑推理等方面表现亮眼,部分测试中甚至超越Claude 3.7。DeepSeek团队延续低调风格,未提前宣传便直接上线,引发行业震动。有预测称,DeepSeek-R2或几周内发布,可能直接对标GPT-5。开源模型的崛起正加速全球AI格局变化,中国AI企业正逐步缩小与美国的技术差距。
原文链接
本文链接:https://kx.umi6.com/article/18133.html
转载请注明文章出处
相关推荐
换一换
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
2025-07-30 12:43:45
智谱董事长刘德兵:完全支持开源,我们已开源 40 多款 AI 模型
2025-11-16 11:28:16
北京人形开源最新VLM模型,推动具身智能再迈关键一步 !
2025-11-14 13:57:27
华为UCM推理记忆管理技术正式开源
2025-11-05 16:17:45
低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!
2025-12-14 22:01:20
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
2025-10-27 11:55:56
通义万相全新动作生成模型开源
2025-09-19 15:17:03
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
阿里云创始人王坚:人工智能时代将带来“计算卫星”
2025-09-11 15:59:12
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
通义千问最新AI编程大模型Qwen3-Coder正式开源
2025-07-23 07:45:34
635 文章
398749 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34