2025年8月6日深夜,Qwen团队发布两款4B端侧模型:Qwen3-4B-Instruct-2507(非推理模型)和Qwen3-4B-Thinking-2507(高级推理模型)。这两款模型支持256k上下文,性能大幅提升。其中,Qwen3-4B-Thinking-2507在AIME25测试中得分81.3,超越Claude 4 Opus和Gemini 2.5 Pro等更大规模模型,尤其在数学、逻辑推理等领域表现突出。新模型对端侧设备友好,甚至可在树莓派上运行,已开源并提供部署建议。此次更新正值OpenAI开源gpt-oss系列同日发布,而GPT-5预计于8月8日凌晨推出,行业竞争激烈。
原文链接
本文链接:https://kx.umi6.com/article/23156.html
转载请注明文章出处
相关推荐
换一换
Meta公开抄阿里Qwen作业,还闭源了…
2025-12-11 12:47:10
苹果首次公布自研模型细节, 揭秘 Apple 智能怎么炼成,即使没有 GPT-4o 也能打
2024-06-12 21:44:04
加速端侧模型布局 OPPO收了一家AI创业企业!
2024-10-23 20:47:20
阿里秘密启动“千问”项目 将推出国际版与ChatGPT竞争
2025-11-13 16:12:52
一年20万台出货,AI 玩具公司Haivivi 刚拿了2亿新融资,我们和创始人聊了聊
2025-08-25 12:30:28
面壁李大海:大模型圈拼的已经不只是堆卡了
2025-03-18 18:47:33
0.5B以小搏大拿下端侧模型新SOTA:4090可跑,长文本处理5倍常规加速丨清华&面壁开源
2025-06-10 16:50:15
奖励是假的,能让Qwen提升25%性能却是真的!
2025-05-29 19:38:47
中国模型打服硅谷:Airbnb联创CEO感叹又好又快又便宜!ChatGPT合作都拒了
2025-10-23 13:03:38
苹果智能海外上线 国产厂商押注AI 欲与之一战
2024-10-29 19:38:49
Qwen上新AI前端工程师!一句话搞定HTML/CSS/JS,新手秒变React大神
2025-05-10 13:05:02
半个月三场大会,AI战火蔓延手机圈
2025-10-28 15:57:16
离线智能,什么时候迎来DeepSeek 时刻?
2025-07-26 14:41:20
740 文章
559467 浏览
24小时热文
更多
-
2026-04-24 19:29:38 -
2026-04-24 18:31:29 -
2026-04-24 18:30:24