综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年1月,阿里千问正式发布Qwen3-Max-Thinking超大杯推理版模型,刷新全球SOTA表现。该模型在科学知识、数学推理、代码编程等19项基准测试中超越GPT-5.2-Thinking、Claude-Opus-4.5等顶级闭源模型。其参数规模超万亿,预训练数据量达36T Tokens,并通过自适应工具调用和测试时扩展技术显著提升推理性能与工具调用能力。实测显示,Qwen3-Max-Thinking可完成复杂代码任务(如手势识别小游戏)和数据分析(如内存涨价研报生成)。此外,中国开源AI模型下载量已超美国,千问系列衍生模型突破20万个,下载量超10亿次,成为全球开源标杆。目前,该模型已上线千问APP及API接口,全面接入淘宝、支付宝等阿里生态业务,为垂直领域应用提供更多可能性。
原文链接
1月26日,阿里发布千问旗舰推理模型Qwen3-Max-Thinking,总参数超万亿。该模型经过更大规模强化学习与推理技术创新,性能大幅提升,在多项基准测试中超越GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等顶尖模型。同时,其自主调用工具的原生Agent能力显著增强,模型幻觉问题大幅降低。目前,普通用户可通过千问PC端和网页端试用,千问APP也将很快接入。(记者 黄心怡)
原文链接
4日,阿里通义千问发布Qwen3-Max-Thinking早期预览版,邀请用户尝鲜试用。据介绍,该模型仍在持续训练中,但即使在当前阶段,借助工具调用和规模化测试计算,其推理能力已在AIME 25和HMMT 25等高难度数学推理基准测试中实现100%准确率,展现出卓越性能。这一进展凸显了阿里在人工智能领域的技术实力,也为用户提供了更强大的数学推理工具选择。
原文链接
正文:2025年11月,Qwen发布半成品模型Qwen3-Max-Thinking早期预览版,在AIME 25和HMMT25数学竞赛中取得满分成绩,超越GPT-5系列此前的最佳表现。该模型已在Qwen Chat上线免费试用,并提供API接口。测试显示,其能高效解决高难度数学题及编程任务,如IMO竞赛题和小球碰撞模拟程序,但在复杂3D建模任务中仍有优化空间。官方表示模型仍在训练中,未来将持续更新。网友热议其强大性能,同时关注开源计划。
原文链接
加载更多
暂无内容