2025年8月6日深夜,Qwen团队发布两款4B端侧模型:Qwen3-4B-Instruct-2507(非推理模型)和Qwen3-4B-Thinking-2507(高级推理模型)。这两款模型支持256k上下文,性能大幅提升。其中,Qwen3-4B-Thinking-2507在AIME25测试中得分81.3,超越Claude 4 Opus和Gemini 2.5 Pro等更大规模模型,尤其在数学、逻辑推理等领域表现突出。新模型对端侧设备友好,甚至可在树莓派上运行,已开源并提供部署建议。此次更新正值OpenAI开源gpt-oss系列同日发布,而GPT-5预计于8月8日凌晨推出,行业竞争激烈。
原文链接
本文链接:https://kx.umi6.com/article/23156.html
转载请注明文章出处
相关推荐
换一换
0.5B以小搏大拿下端侧模型新SOTA:4090可跑,长文本处理5倍常规加速丨清华&面壁开源
2025-06-10 16:50:15
一年20万台出货,AI 玩具公司Haivivi 刚拿了2亿新融资,我们和创始人聊了聊
2025-08-25 12:30:28
半个月三场大会,AI战火蔓延手机圈
2025-10-28 15:57:16
Qwen版o1发布即开源!32B参数比肩OpenAI o1-mini,一手实测在此
2024-11-28 21:36:58
阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队
2025-10-11 09:17:58
苹果智能海外上线 国产厂商押注AI 欲与之一战
2024-10-29 19:38:49
苹果公布自研模型细节:没有GPT-4o也能打?
2024-06-12 22:54:41
大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?
2024-12-31 11:39:44
幸好苹果国行AI 没有选择DeepSeek
2025-02-12 18:36:24
苹果首次公布自研模型细节, 揭秘 Apple 智能怎么炼成,即使没有 GPT-4o 也能打
2024-06-12 21:44:04
狂奔一年后,面壁者决心“破壁”
2024-12-21 21:04:40
手机厂开卷AI这一年 端侧大模型越做越小?|一线
2024-10-11 19:09:47
面壁智能CEO李大海:大模型正在走向“无所不能”和“无处不在”|AI领先者心声・2025
2025-01-13 14:57:27
740 文章
559359 浏览
24小时热文
更多
-
2026-04-24 18:29:17 -
2026-04-24 18:28:12 -
2026-04-24 18:27:05