7月31日,阿里通义千问发布全新推理模型Qwen3-30B-A3B-Thinking-2507,多项能力显著提升。新模型在数学能力评测AIME25中获85.0高分,代码能力测试LiveCodeBench v6得分66.0,超越Gemini2.5-Flash和Qwen3-235B-A22B。其知识水平、写作、Agent能力、多轮对话及多语言指令遵循等通用能力均表现优异。上下文长度原生支持256K tokens,可扩展至1M tokens,思考长度也增加,适合复杂推理任务。该模型已开源,可在魔搭社区、HuggingFace获取,并支持消费级硬件本地部署,同时上线Qwen Chat平台。
原文链接
本文链接:https://kx.umi6.com/article/22742.html
转载请注明文章出处
相关推荐
换一换
英伟达突然开源新模型,直逼DeepSeek-R1成推理天花板
2025-04-09 13:50:12
LLM神话破灭?苹果论文最新实锤:难以实现真正智能
2025-06-09 20:34:34
不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究
2025-04-30 18:55:15
OpenAI最强推理模型o3发布,首次能用图片思考
2025-04-17 09:29:43
最强32B中文推理大模型易主:开源免费商用,1/20 DeepSeek-R1参数量SOTA,权重代码数据集全开源
2025-04-13 21:56:24
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex
2026-01-06 14:06:10
科沃斯与阿里云达成全栈 AI 合作,扫地机器人接入通义千问
2025-09-28 15:56:06
阿里千问3推理模型更新 比肩Gemini-2.5 pro、o4-mini
2025-07-25 19:28:30
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
OpenAI上架推理模型o3-mini 首次向免费用户开放推理功能
2025-02-01 05:13:09
DeepSeek R1遇难题142次”I give up”,研究还称需增加推理时机控制机制
2025-02-14 13:35:29
网易有道推出轻量级推理模型“子曰-o1”,更小规模实现更强推理效果
2025-01-22 12:54:57
阿里巴巴CEO吴泳铭主张在阿里现有业务中全面实现“AI化”
2025-03-18 09:27:26
699 文章
523152 浏览
24小时热文
更多
-
2026-03-10 09:02:22 -
2026-03-10 09:01:12 -
2026-03-10 09:00:02