综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4日,阿里通义千问发布Qwen3-Max-Thinking早期预览版,邀请用户尝鲜试用。据介绍,该模型仍在持续训练中,但即使在当前阶段,借助工具调用和规模化测试计算,其推理能力已在AIME 25和HMMT 25等高难度数学推理基准测试中实现100%准确率,展现出卓越性能。这一进展凸显了阿里在人工智能领域的技术实力,也为用户提供了更强大的数学推理工具选择。
原文链接
正文:2025年11月,Qwen发布半成品模型Qwen3-Max-Thinking早期预览版,在AIME 25和HMMT25数学竞赛中取得满分成绩,超越GPT-5系列此前的最佳表现。该模型已在Qwen Chat上线免费试用,并提供API接口。测试显示,其能高效解决高难度数学题及编程任务,如IMO竞赛题和小球碰撞模拟程序,但在复杂3D建模任务中仍有优化空间。官方表示模型仍在训练中,未来将持续更新。网友热议其强大性能,同时关注开源计划。
原文链接
加载更多
暂无内容