9月24日,阿里云发布通义千问系列最强语言模型Qwen3-Max正式版。该模型参数超万亿,预训练使用36T tokens,在代码能力、智能体任务及多语言理解等方面性能全面领先。其推理增强版Qwen3-Max-Thinking在高难度数学基准测试AIME 25和HMMT中取得满分。此外,Qwen3-Max-Instruct在SWE-Bench Verified编程基准测试中获69.6分,并在Tau2-Bench智能体工具调用评估中以74.8分超越Claude Opus 4等顶尖模型。目前,Qwen3-Max-Thinking仍在训练中,预计不久后发布。
原文链接
本文链接:https://kx.umi6.com/article/25740.html
转载请注明文章出处
相关推荐
换一换
通义千问开源全新文生图模型Qwen-Image
2025-08-05 07:09:44
阿里云发布 AI 硬件多模态交互开发套件:集成通义大模型,适配 30 多款终端芯片
2026-01-08 13:12:06
AI动力十足!阿里云超预期增长 收入大涨26%创三年新高
2025-08-29 18:42:25
阿里云通义千问 Qwen 3 旗舰版模型宣布更新:性能全面提升,超越 Kimi、DeepSeek 等行业顶尖水平
2025-07-22 07:27:05
阿里云百炼官宣通义千问3-Max模型降价
2025-11-13 23:26:41
阿里云扩建全球基础设施 将新增巴西、法国和荷兰数据中心
2025-09-24 15:50:13
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
阿里云发布手机“一键养虾”产品JVS Claw:3分钟实现养虾自由
2026-03-13 19:39:21
乐聚机器人联手阿里云,千问大模型为人形机器人注入“具身智能”
2026-01-09 15:24:19
阿里云与英伟达联合推动具身智能应用落地
2025-09-24 15:43:00
乐聚机器人与阿里云达成全栈AI合作
2026-01-08 18:25:41
独家|阿里组织架构调整:通义实验室升级为事业部 李飞飞出任阿里云CTO
2026-04-08 17:04:05
性能赶超NVIDIA!阿里云AI算力服务大涨价 最高达34%
2026-03-19 15:05:35
713 文章
618771 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41