2025年9月6日,阿里发布其迄今为止最大的万亿参数模型Qwen3-Max-Preview(Instruct),较前一代Qwen3(235B)参数量提升四倍。新模型在中英文理解、复杂指令遵循及工具调用等方面显著增强,并大幅减少知识幻觉,全面上线通义APP、Qwen Chat网页和阿里云API。实测显示,该模型在解答AIME数学竞赛题、编程生成互动动画、扫雷游戏及前端网页设计等任务中表现出色,所有尝试均一次成功,且生成速度达107+ token/秒。API采用阶梯计费,支持长上下文输入。阿里透露正式版即将推出,可能伴随推理版本,进一步扩展模型规模。
原文链接
本文链接:https://kx.umi6.com/article/24794.html
转载请注明文章出处
相关推荐
.png)
换一换
Claude4发布:替代人类程序员所需的条件,现在它都有了
2025-05-23 10:49:07
OpenAI GPT-5 编程成绩有猫腻:自删 23 道测试题,关键基准还是自己提的
2025-08-12 13:18:21
第一时间体验GPT-5,人人免费可用,马斯克表示不服
2025-08-08 06:03:18
GPT-5来了!人人都能免费用,最强大模型只需最傻瓜式使用
2025-08-08 04:01:37
DeepSeek又更新了!化身更强AI设计师、程序员 比肩全球最强代码生成器?
2025-03-25 09:48:08
通义千问系列最强大的语言模型:Qwen3-Max-Preview 上线
2025-09-06 00:26:52
Anthropic放大招:AI能像人一样操作电脑,你旁边看着就行
2024-10-23 11:34:20
初探 Deepseek R1-0528 开源模型:AI 编程能力跃升,媲美 OpenAI o3 和 o4-mini
2025-05-29 10:08:36
OpenAI内部模型曝光:编程能力跻身全球Top50 年底超越任何人类
2025-02-09 23:55:42
DeepSeek R1悄悄更新,用“小版本”干翻大模型
2025-05-29 18:39:30
阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
2025-09-06 00:27:49
实测DeepSeek V3.1,不止拓展上下文长度
2025-08-20 17:21:15
首个混合推理模型Claude 3.7发布!编程能力全面领先,还能控制思考时间
2025-02-25 15:56:21
527 文章
174064 浏览
24小时热文
更多

-
2025-09-06 14:35:37
-
2025-09-06 14:35:21
-
2025-09-06 12:37:21