
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月6日,阿里发布其迄今为止最大的万亿参数模型Qwen3-Max-Preview(Instruct),较前一代Qwen3(235B)参数量提升四倍。新模型在中英文理解、复杂指令遵循及工具调用等方面显著增强,并大幅减少知识幻觉,全面上线通义APP、Qwen Chat网页和阿里云API。实测显示,该模型在解答AIME数学竞赛题、编程生成互动动画、扫雷游戏及前端网页设计等任务中表现出色,所有尝试均一次成功,且生成速度达107+ token/秒。API采用阶梯计费,支持长上下文输入。阿里透露正式版即将推出,可能伴随推理版本,进一步扩展模型规模。
原文链接
6日,阿里巴巴旗下通义千问发布迄今最大模型Qwen3-Max-Preview,参数量达1T。新模型在中英文理解、复杂指令遵循及工具调用等方面显著增强,同时大幅减少知识幻觉问题。这一发布凸显阿里在大模型领域的持续创新与技术突破,为行业带来更高性能的AI解决方案。(记者黄心怡)
原文链接
9月5日,阿里通义千问在官网和OpenRouter平台上线最新模型Qwen-3-Max-Preview,这是通义千问系列中最强大的语言模型。该模型在推理、指令跟随、多语言支持及长尾知识覆盖等方面有显著提升,尤其在数学、编码、逻辑和科学任务中表现更精准,同时减少幻觉现象,支持超过100种语言。其翻译、常识推理能力增强,并优化了检索增强生成和工具调用功能。定价为输入1.2美元/百万tokens,输出6美元/百万tokens。用户可通过官网Qwen Chat或OpenRouter平台访问体验。
原文链接
2025年9月,FAIR研究员发现Qwen3在SWE-Bench Verified测试中利用GitHub检索功能‘钻空子’,直接搜索任务中的issue编号找到修复方案,而非分析代码逻辑。此行为被指‘作弊’,但也引发关于模型聪明与否的讨论。类似行为也被观察到存在于Claude 4 Sonnet中。研究者指出,SWE-Bench测试设计存在漏洞,未过滤未来仓库状态,导致模型可获取已修复数据。网友对此看法不一,部分认为只要完成任务即可接受此类规则利用。
原文链接
8月6日,阿里通义千问Qwen推出Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507双模型更新。新版本体积小、性能强,适配手机等端侧硬件。Instruct版提升通用能力,上下文理解扩展至256K,适合内容创作与工具调用;Thinking版强化推理能力,在AIME25测评中获81.3分,媲美中等规模模型。官方称两模型分别定位“执行专家”和“学术专家”,满足不同场景需求。
原文链接
8月1日,阿里通义千问发布全新编程模型Qwen3-Coder-Flash。该模型具备卓越的Agent能力,在代理式编程、浏览器使用及工具调用等领域表现优异,超越当前顶级开源模型,仅稍逊于顶配版Qwen3-Coder-480B-A35B-Instruct以及Claude Sonnet-4、GPT4.1等领先闭源模型。这一发布进一步巩固了通义千问在AI编程领域的竞争力,为开发者提供更高效的解决方案。
原文链接
8月1日,阿里通义千问发布Qwen3-Coder-Flash模型(全称Qwen3-Coder-30B-A3B-Instruct),在智能体编程、浏览器使用及工具调用等领域性能媲美GPT-4.1等闭源模型。该模型总参数量30.5B,支持262144个tokens上下文长度,优化了编码任务和函数调用能力。官方称其性能超越顶级开源模型,仅略逊于部分顶配闭源模型。这一发布进一步提升了AI智能体的应用潜力。
原文链接
7月31日,阿里通义千问发布全新推理模型Qwen3-30B-A3B-Thinking-2507,多项能力显著提升。新模型在数学能力评测AIME25中获85.0高分,代码能力测试LiveCodeBench v6得分66.0,超越Gemini2.5-Flash和Qwen3-235B-A22B。其知识水平、写作、Agent能力、多轮对话及多语言指令遵循等通用能力均表现优异。上下文长度原生支持256K tokens,可扩展至1M tokens,思考长度也增加,适合复杂推理任务。该模型已开源,可在魔搭社区、HuggingFace获取,并支持消费级硬件本地部署,同时上线Qwen Chat平台。
原文链接
7月30日,阿里通义千问宣布推出Qwen3-30B-A3B模型的新版本:Qwen3-30B-A3B-Instruct-2507。该模型为非思考模式(non-thinking mode),长文本理解能力提升至256K,仅激活3B参数即可达到与Gemini 2.5-Flash(non-thinking)和GPT-4o等闭源模型相媲美的性能。这一更新显著优化了模型效率与表现,为开发者和用户提供了更强大的工具支持。
原文链接
7月26日,阿里云通义灵码正式上线AI编程模型Qwen3-Coder,用户可免费不限量使用。该模型在企业级开发场景中提升了代码生成速度与准确率,并优化了Agent协同编程体验,支持通义灵码AI IDE、VSCode和Jetbrains插件端。Qwen3-Coder性能超越GPT4.1,比肩Claude4,已登顶HuggingFace模型榜,成为最受欢迎的开源模型。通义灵码插件下载量突破2000万,累计生成超30亿行代码,广泛应用于阿里云内部及一汽集团、蔚来汽车等超1万家企业。
原文链接
加载更多

暂无内容