
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
10月22日,阿里云通义千问宣布Qwen3-VL家族新增2B与32B两个密集(Dense)模型尺寸。至此,Qwen3-VL已开源四款Dense模型(2B、4B、8B、32B)及两款MoE模型(30B-A3B、235B-A22B)。每款模型均提供Instruct和Thinking两大版本,并同步推出12个FP8量化版,累计24个开源权重模型可在魔搭社区和Hugging Face免费下载商用。
原文链接
正文:10月22日,阿里通义千问宣布Qwen3-VL家族新增2B与32B两个密集模型尺寸,覆盖视觉语言理解场景。官方称,新模型可在手机运行,适合开发者使用。此次提供Instruct和Thinking两种版本:Instruct响应快、执行稳,适合对话与工具调用;Thinking强化复杂推理与视觉理解,擅长高难度任务。Qwen3-VL-32B在STEM、VQA、OCR等领域表现优于GPT-5 mini和Claude 4 Sonnet,仅32B参数媲美235B模型。Qwen3-VL-2B体积小,能在端侧设备运行,便于实验与部署。体验地址:ModelScope和Hugging Face。
原文链接
10月15日,阿里通义宣布Qwen3-VL系列新增4B与8B两款Dense架构视觉理解模型,并开源上线。Qwen3-VL-8B在STEM、VQA、OCR等任务中表现优异,超越Gemini 2.5 Flash Lite和GPT-5 Nano,接近上一代超大模型Qwen2.5-VL-72B的性能;4B版本则更适合端侧部署,性价比突出。两款模型通过技术优化解决了小模型常见的“跷跷板”问题,在文本稳健性与视觉精准性上实现协同突破。新模型已上线魔搭社区和Hugging Face,同时提供FP8版本,供开发者使用。
原文链接
10月4日,华为宣布昇腾0day支持阿里云通义千问Qwen3-VL-30B-A3B模型适配。该模型在视觉理解方面显著提升,同时保持强大文本处理能力。主要功能包括视觉代理、增强的视觉编码、高级空间感知、长上下文与视频理解等。此外,扩展的OCR支持32种语言,文本-视觉融合实现无损理解。此次适配延续了昇腾对Qwen系列的支持,新模型发布后即在LLaMA Factory和vLLM中开箱可用。此前,9月29日发布的DeepSeek-V3.2-Exp也实现0day支持,并开源推理代码与算子实现。
原文链接
10月4日,阿里云通义千问宣布开源Qwen3-VL-30B-A3B-Instruct与Thinking模型,并推出FP8版本及超大规模模型Qwen3-VL-235B-A22B的FP8版本。新模型以仅30亿激活参数,在STEM、视觉问答(VQA)、OCR、视频理解及智能体任务等领域媲美GPT-5-Mini和Claude4-Sonnet,部分表现更优。该模型具备更强的文本理解、视觉感知、空间推理及多模态处理能力,支持长达256K上下文(可扩展至1M),并优化了OCR功能与视觉代理能力。模型已在魔搭社区和Hugging Face免费开放下载,同时上线Qwen Chat,供开发者灵活部署与使用。
原文链接
9月28日,阿里云通义团队推出Qwen3Guard,这是Qwen家族首款专为安全防护设计的护栏模型。基于Qwen3基础架构,该模型针对安全分类任务优化,可高效识别用户输入和AI回复中的潜在风险,并输出细粒度的风险等级与分类标签。Qwen3Guard在主流安全评测中表现领先,支持英语、中文及多语言场景。提供两大版本:Qwen3Guard-Gen适用于离线数据标注和强化学习,Qwen3Guard-Stream实现流式实时检测,提升在线服务效率。模型适配0.6B、4B、8B三种参数规模,支持119种语言,满足全球部署需求。更多信息可参考HuggingFace、ModelScope及阿里云AI安全护栏服务官网。
原文链接
9月24日,阿里巴巴发布全模态预训练大模型Qwen3-Omni系列。该模型在36个音视频基准测试中,22项达SOTA水平,32项取得开源模型最佳效果,语音识别、音频理解与对话能力媲美Gemini2.5-Pro。Qwen3-Omni支持全模态输入输出,通过多模态混合训练实现“听”“说”“写”能力,预训练采用单模态与跨模态数据结合。其在音频、音视频能力突出的同时,文本与图像性能保持稳定,首次实现业内这一综合训练效果。
原文链接
2025年9月,阿里云在云栖大会上发布多项AI技术突破。新一代旗舰模型Qwen3-Max首次在AIME25和HMMT数学评测中拿下满分100分,参数量超万亿,分为指令版和思考版,性能全面提升。视觉模型Qwen3-VL重磅开源,在多项视觉感知评测中超越Gemini 2.5 Pro,并支持复杂视频理解。全模态模型Qwen3-Omni统一文本、图像、音频和视频,衍生出的Qwen3-LiveTranslate实现18种语言实时翻译,准确率领先行业。此外,Qwen3-Coder-Plus升级显著提升编程能力。阿里云智能集团CEO吴泳铭表示,AGI是起点,目标是发展超级人工智能(ASI)。同日,高效架构Qwen3-Next发布,激活3B参数即可媲美235B模型,训练成本降低超90%。
原文链接
9月24日,阿里巴巴正式发布Qwen3-Max,这是其迄今规模最大、能力最强的模型。预览版Qwen3-Max-Instruct在LMArena文本排行榜中排名第三,超越GPT-5-Chat。正式版本在代码能力和智能体任务方面进一步提升,在知识、推理、编程、指令遵循等多领域基准测试中均达到业界领先水平。
原文链接
9月24日,阿里云发布通义千问系列最强语言模型Qwen3-Max正式版。该模型参数超万亿,预训练使用36T tokens,在代码能力、智能体任务及多语言理解等方面性能全面领先。其推理增强版Qwen3-Max-Thinking在高难度数学基准测试AIME 25和HMMT中取得满分。此外,Qwen3-Max-Instruct在SWE-Bench Verified编程基准测试中获69.6分,并在Tau2-Bench智能体工具调用评估中以74.8分超越Claude Opus 4等顶尖模型。目前,Qwen3-Max-Thinking仍在训练中,预计不久后发布。
原文链接
加载更多

暂无内容