综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
10月22日,阿里云通义千问宣布Qwen3-VL家族新增2B与32B两个密集(Dense)模型尺寸。至此,Qwen3-VL已开源四款Dense模型(2B、4B、8B、32B)及两款MoE模型(30B-A3B、235B-A22B)。每款模型均提供Instruct和Thinking两大版本,并同步推出12个FP8量化版,累计24个开源权重模型可在魔搭社区和Hugging Face免费下载商用。
原文链接
正文:10月22日,阿里通义千问宣布Qwen3-VL家族新增2B与32B两个密集模型尺寸,覆盖视觉语言理解场景。官方称,新模型可在手机运行,适合开发者使用。此次提供Instruct和Thinking两种版本:Instruct响应快、执行稳,适合对话与工具调用;Thinking强化复杂推理与视觉理解,擅长高难度任务。Qwen3-VL-32B在STEM、VQA、OCR等领域表现优于GPT-5 mini和Claude 4 Sonnet,仅32B参数媲美235B模型。Qwen3-VL-2B体积小,能在端侧设备运行,便于实验与部署。体验地址:ModelScope和Hugging Face。
原文链接
10月15日,阿里通义宣布Qwen3-VL系列新增4B与8B两款Dense架构视觉理解模型,并开源上线。Qwen3-VL-8B在STEM、VQA、OCR等任务中表现优异,超越Gemini 2.5 Flash Lite和GPT-5 Nano,接近上一代超大模型Qwen2.5-VL-72B的性能;4B版本则更适合端侧部署,性价比突出。两款模型通过技术优化解决了小模型常见的“跷跷板”问题,在文本稳健性与视觉精准性上实现协同突破。新模型已上线魔搭社区和Hugging Face,同时提供FP8版本,供开发者使用。
原文链接
10月4日,华为宣布昇腾0day支持阿里云通义千问Qwen3-VL-30B-A3B模型适配。该模型在视觉理解方面显著提升,同时保持强大文本处理能力。主要功能包括视觉代理、增强的视觉编码、高级空间感知、长上下文与视频理解等。此外,扩展的OCR支持32种语言,文本-视觉融合实现无损理解。此次适配延续了昇腾对Qwen系列的支持,新模型发布后即在LLaMA Factory和vLLM中开箱可用。此前,9月29日发布的DeepSeek-V3.2-Exp也实现0day支持,并开源推理代码与算子实现。
原文链接
10月4日,阿里云通义千问宣布开源Qwen3-VL-30B-A3B-Instruct与Thinking模型,并推出FP8版本及超大规模模型Qwen3-VL-235B-A22B的FP8版本。新模型以仅30亿激活参数,在STEM、视觉问答(VQA)、OCR、视频理解及智能体任务等领域媲美GPT-5-Mini和Claude4-Sonnet,部分表现更优。该模型具备更强的文本理解、视觉感知、空间推理及多模态处理能力,支持长达256K上下文(可扩展至1M),并优化了OCR功能与视觉代理能力。模型已在魔搭社区和Hugging Face免费开放下载,同时上线Qwen Chat,供开发者灵活部署与使用。
原文链接
2025年9月,阿里云在云栖大会上发布多项AI技术突破。新一代旗舰模型Qwen3-Max首次在AIME25和HMMT数学评测中拿下满分100分,参数量超万亿,分为指令版和思考版,性能全面提升。视觉模型Qwen3-VL重磅开源,在多项视觉感知评测中超越Gemini 2.5 Pro,并支持复杂视频理解。全模态模型Qwen3-Omni统一文本、图像、音频和视频,衍生出的Qwen3-LiveTranslate实现18种语言实时翻译,准确率领先行业。此外,Qwen3-Coder-Plus升级显著提升编程能力。阿里云智能集团CEO吴泳铭表示,AGI是起点,目标是发展超级人工智能(ASI)。同日,高效架构Qwen3-Next发布,激活3B参数即可媲美235B模型,训练成本降低超90%。
原文链接
加载更多
暂无内容