
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月,阿里云在云栖大会上发布多项AI技术突破。新一代旗舰模型Qwen3-Max首次在AIME25和HMMT数学评测中拿下满分100分,参数量超万亿,分为指令版和思考版,性能全面提升。视觉模型Qwen3-VL重磅开源,在多项视觉感知评测中超越Gemini 2.5 Pro,并支持复杂视频理解。全模态模型Qwen3-Omni统一文本、图像、音频和视频,衍生出的Qwen3-LiveTranslate实现18种语言实时翻译,准确率领先行业。此外,Qwen3-Coder-Plus升级显著提升编程能力。阿里云智能集团CEO吴泳铭表示,AGI是起点,目标是发展超级人工智能(ASI)。同日,高效架构Qwen3-Next发布,激活3B参数即可媲美235B模型,训练成本降低超90%。
原文链接
9月24日,阿里巴巴正式发布Qwen3-Max,这是其迄今规模最大、能力最强的模型。预览版Qwen3-Max-Instruct在LMArena文本排行榜中排名第三,超越GPT-5-Chat。正式版本在代码能力和智能体任务方面进一步提升,在知识、推理、编程、指令遵循等多领域基准测试中均达到业界领先水平。
原文链接
9月24日,阿里云发布通义千问系列最强语言模型Qwen3-Max正式版。该模型参数超万亿,预训练使用36T tokens,在代码能力、智能体任务及多语言理解等方面性能全面领先。其推理增强版Qwen3-Max-Thinking在高难度数学基准测试AIME 25和HMMT中取得满分。此外,Qwen3-Max-Instruct在SWE-Bench Verified编程基准测试中获69.6分,并在Tau2-Bench智能体工具调用评估中以74.8分超越Claude Opus 4等顶尖模型。目前,Qwen3-Max-Thinking仍在训练中,预计不久后发布。
原文链接
9月6日,阿里在通义千问官网和OpenRouter平台上线了Qwen3-Max-Preview模型,官方称其为通义千问系列中最强大的语言模型。该模型参数量达1T,在中英文理解、复杂指令遵循及工具调用等方面显著增强,同时大幅减少知识幻觉,提升了可靠性和智能性。在Arena-Hard v2基准测试中表现领先,并在AIME25推理能力测试中获得80.6分,逻辑思维能力突出。新模型将优化复杂工作流处理和高质量对话体验。此外,本次更新采用按输入长度阶梯计费模式,用户可通过Qwen Chat或阿里云百炼API服务进行体验。
原文链接
2025年9月6日,阿里发布其迄今为止最大的万亿参数模型Qwen3-Max-Preview(Instruct),较前一代Qwen3(235B)参数量提升四倍。新模型在中英文理解、复杂指令遵循及工具调用等方面显著增强,并大幅减少知识幻觉,全面上线通义APP、Qwen Chat网页和阿里云API。实测显示,该模型在解答AIME数学竞赛题、编程生成互动动画、扫雷游戏及前端网页设计等任务中表现出色,所有尝试均一次成功,且生成速度达107+ token/秒。API采用阶梯计费,支持长上下文输入。阿里透露正式版即将推出,可能伴随推理版本,进一步扩展模型规模。
原文链接
6日,阿里巴巴旗下通义千问发布迄今最大模型Qwen3-Max-Preview,参数量达1T。新模型在中英文理解、复杂指令遵循及工具调用等方面显著增强,同时大幅减少知识幻觉问题。这一发布凸显阿里在大模型领域的持续创新与技术突破,为行业带来更高性能的AI解决方案。(记者黄心怡)
原文链接
9月5日,阿里通义千问在官网和OpenRouter平台上线最新模型Qwen-3-Max-Preview,这是通义千问系列中最强大的语言模型。该模型在推理、指令跟随、多语言支持及长尾知识覆盖等方面有显著提升,尤其在数学、编码、逻辑和科学任务中表现更精准,同时减少幻觉现象,支持超过100种语言。其翻译、常识推理能力增强,并优化了检索增强生成和工具调用功能。定价为输入1.2美元/百万tokens,输出6美元/百万tokens。用户可通过官网Qwen Chat或OpenRouter平台访问体验。
原文链接
加载更多

暂无内容