2025年9月6日,阿里发布其迄今为止最大的万亿参数模型Qwen3-Max-Preview(Instruct),较前一代Qwen3(235B)参数量提升四倍。新模型在中英文理解、复杂指令遵循及工具调用等方面显著增强,并大幅减少知识幻觉,全面上线通义APP、Qwen Chat网页和阿里云API。实测显示,该模型在解答AIME数学竞赛题、编程生成互动动画、扫雷游戏及前端网页设计等任务中表现出色,所有尝试均一次成功,且生成速度达107+ token/秒。API采用阶梯计费,支持长上下文输入。阿里透露正式版即将推出,可能伴随推理版本,进一步扩展模型规模。
原文链接
本文链接:https://kx.umi6.com/article/24794.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手
2025-02-09 12:43:47
阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
2025-09-06 00:27:49
Anthropic放大招:AI能像人一样操作电脑,你旁边看着就行
2024-10-23 11:34:20
Claude4发布:替代人类程序员所需的条件,现在它都有了
2025-05-23 10:49:07
OpenAI GPT-5 编程成绩有猫腻:自删 23 道测试题,关键基准还是自己提的
2025-08-12 13:18:21
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4
2025-08-21 10:27:32
实测GPT-5:写作坠入谷底,编程一骑绝尘
2025-08-08 09:11:19
初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini
2025-05-29 10:08:36
GPT-5泄露!首次统一GPT和o系列,实测demo抢先曝光,下周发布?
2025-08-01 08:52:52
实测DeepSeek V3.1,不止拓展上下文长度
2025-08-20 17:21:15
地表最强编程 AI 模型另一面:Claude Opus 4 逃逸、勒索工程师等,官方施加 ASL-3 紧箍咒
2025-05-23 07:44:23
DeepSeek R1悄悄更新,用“小版本”干翻大模型
2025-05-29 18:39:30
第一时间体验GPT-5,人人免费可用,马斯克表示不服
2025-08-08 06:03:18
572 文章
273094 浏览
24小时热文
更多

-
2025-10-23 18:14:34
-
2025-10-23 18:13:26
-
2025-10-23 18:12:20