2025年8月6日深夜,Qwen团队发布两款4B端侧模型:Qwen3-4B-Instruct-2507(非推理模型)和Qwen3-4B-Thinking-2507(高级推理模型)。这两款模型支持256k上下文,性能大幅提升。其中,Qwen3-4B-Thinking-2507在AIME25测试中得分81.3,超越Claude 4 Opus和Gemini 2.5 Pro等更大规模模型,尤其在数学、逻辑推理等领域表现突出。新模型对端侧设备友好,甚至可在树莓派上运行,已开源并提供部署建议。此次更新正值OpenAI开源gpt-oss系列同日发布,而GPT-5预计于8月8日凌晨推出,行业竞争激烈。
原文链接
本文链接:https://kx.umi6.com/article/23156.html
转载请注明文章出处
相关推荐
.png)
换一换
中国模型打服硅谷:Airbnb联创CEO感叹又好又快又便宜!ChatGPT合作都拒了
2025-10-23 13:03:38
奖励是假的,能让Qwen提升25%性能却是真的!
2025-05-29 19:38:47
加速端侧模型布局 OPPO收了一家AI创业企业!
2024-10-23 20:47:20
面壁李大海:大模型圈拼的已经不只是堆卡了
2025-03-18 18:47:33
手机厂开卷AI这一年 端侧大模型越做越小?|一线
2024-10-11 19:09:47
苹果公布自研模型细节:没有GPT-4o也能打?
2024-06-12 22:54:41
幸好苹果国行AI 没有选择DeepSeek
2025-02-12 18:36:24
苹果首次公布自研模型细节, 揭秘 Apple 智能怎么炼成,即使没有 GPT-4o 也能打
2024-06-12 21:44:04
阿里千问(Qwen)衍生模型数量破 10 万,位居全球开源模型榜首
2025-02-25 17:02:40
苹果智能海外上线 国产厂商押注AI 欲与之一战
2024-10-29 19:38:49
Qwen上新AI前端工程师!一句话搞定HTML/CSS/JS,新手秒变React大神
2025-05-10 13:05:02
0.5B以小搏大拿下端侧模型新SOTA:4090可跑,长文本处理5倍常规加速丨清华&面壁开源
2025-06-10 16:50:15
断网也能用!贾扬清团队推出端侧模型Chrome插件,arXiv/B站/吃瓜一件搞定
2024-07-19 15:47:28
563 文章
257502 浏览
24小时热文
更多

-
2025-10-23 21:15:29
-
2025-10-23 20:16:19
-
2025-10-23 20:15:12