AIME25 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Qwen紧追OpenAI开源4B端侧大模型，AIME25得分超越Claude 4 Opus

2025年8月6日深夜，Qwen团队发布两款4B端侧模型：Qwen3-4B-Instruct-2507（非推理模型）和Qwen3-4B-Thinking-2507（高级推理模型）。这两款模型支持256k上下文，性能大幅提升。其中，Qwen3-4B-Thinking-2507在AIME25测试中得分81.3，超越Claude 4 Opus和Gemini 2.5 Pro等更大规模模型，尤其在数学、逻辑推理等领域表现突出。新模型对端侧设备友好，甚至可在树莓派上运行，已开源并提供部署建议。此次更新正值OpenAI开源gpt-oss系列同日发布，而GPT-5预计于8月8日凌晨推出，行业竞争激烈。

原文链接