
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年8月6日深夜,Qwen团队发布两款4B端侧模型:Qwen3-4B-Instruct-2507(非推理模型)和Qwen3-4B-Thinking-2507(高级推理模型)。这两款模型支持256k上下文,性能大幅提升。其中,Qwen3-4B-Thinking-2507在AIME25测试中得分81.3,超越Claude 4 Opus和Gemini 2.5 Pro等更大规模模型,尤其在数学、逻辑推理等领域表现突出。新模型对端侧设备友好,甚至可在树莓派上运行,已开源并提供部署建议。此次更新正值OpenAI开源gpt-oss系列同日发布,而GPT-5预计于8月8日凌晨推出,行业竞争激烈。
原文链接
加载更多

暂无内容