Qwen3-VL - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

多模态检索新标杆，阿里通义发布并开源 Qwen3-VL-Embedding&Reranker 模型

1月8日，阿里通义正式发布并开源Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列。两款模型基于Qwen3-VL构建，专为多模态信息检索与跨模态理解设计，支持文本、图像、视频等多模态输入，在图文检索、视频匹配、视觉问答等任务中表现优异。Qwen3-VL-Embedding通过统一表示学习生成语义向量，实现高效跨模态检索；Qwen3-VL-Reranker则优化重排序，输出精确相关性分数，二者协同构成“两阶段检索流程”。该系列支持超30种语言，性能在MMEB-v2、MMTEB等权威基准测试中领先业界，适合全球化部署。模型已开源，可通过GitHub和魔搭ModelScope获取。

原文链接

心智奇点

01-08 23:37:36

Qwen3-VL-Embedding

Qwen3-VL-Reranker

多模态检索

分享至

打开微信扫一扫

内容投诉

生成图片

通义千问Qwen3-VL家族新增两个Dense模型尺寸

10月22日，阿里云通义千问宣布Qwen3-VL家族新增2B与32B两个密集（Dense）模型尺寸。至此，Qwen3-VL已开源四款Dense模型（2B、4B、8B、32B）及两款MoE模型（30B-A3B、235B-A22B）。每款模型均提供Instruct和Thinking两大版本，并同步推出12个FP8量化版，累计24个开源权重模型可在魔搭社区和Hugging Face免费下载商用。

原文链接

新智燎原

10-22 17:51:24

Dense模型

Qwen3-VL

通义千问

分享至

打开微信扫一扫

内容投诉

生成图片

阿里通义 Qwen3-VL 新增 2B、32B 两个密集模型尺寸，手机也能跑

正文：10月22日，阿里通义千问宣布Qwen3-VL家族新增2B与32B两个密集模型尺寸，覆盖视觉语言理解场景。官方称，新模型可在手机运行，适合开发者使用。此次提供Instruct和Thinking两种版本：Instruct响应快、执行稳，适合对话与工具调用；Thinking强化复杂推理与视觉理解，擅长高难度任务。Qwen3-VL-32B在STEM、VQA、OCR等领域表现优于GPT-5 mini和Claude 4 Sonnet，仅32B参数媲美235B模型。Qwen3-VL-2B体积小，能在端侧设备运行，便于实验与部署。体验地址：ModelScope和Hugging Face。

原文链接

梦境编程师

10-22 14:45:02

Qwen3-VL

密集模型

视觉语言理解

分享至

打开微信扫一扫

内容投诉

生成图片

超越 GPT-5 Nano，阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线

10月15日，阿里通义宣布Qwen3-VL系列新增4B与8B两款Dense架构视觉理解模型，并开源上线。Qwen3-VL-8B在STEM、VQA、OCR等任务中表现优异，超越Gemini 2.5 Flash Lite和GPT-5 Nano，接近上一代超大模型Qwen2.5-VL-72B的性能；4B版本则更适合端侧部署，性价比突出。两款模型通过技术优化解决了小模型常见的“跷跷板”问题，在文本稳健性与视觉精准性上实现协同突破。新模型已上线魔搭社区和Hugging Face，同时提供FP8版本，供开发者使用。

原文链接

镜像现实MirageX

10-15 13:33:22

Qwen3-VL

开源

视觉理解

分享至

打开微信扫一扫

内容投诉

生成图片

华为昇腾 0day 支持阿里 Qwen3-VL-30B-A3B 模型适配

10月4日，华为宣布昇腾0day支持阿里云通义千问Qwen3-VL-30B-A3B模型适配。该模型在视觉理解方面显著提升，同时保持强大文本处理能力。主要功能包括视觉代理、增强的视觉编码、高级空间感知、长上下文与视频理解等。此外，扩展的OCR支持32种语言，文本-视觉融合实现无损理解。此次适配延续了昇腾对Qwen系列的支持，新模型发布后即在LLaMA Factory和vLLM中开箱可用。此前，9月29日发布的DeepSeek-V3.2-Exp也实现0day支持，并开源推理代码与算子实现。

原文链接

跨界思维

10-05 09:15:34

0day适配

Qwen3-VL-30B-A3B

华为昇腾

分享至

打开微信扫一扫

内容投诉

生成图片

阿里云通义千问开源 Qwen3-VL-30B-A3B 模型：智能体任务等领域媲美 GPT-5-Mini

10月4日，阿里云通义千问宣布开源Qwen3-VL-30B-A3B-Instruct与Thinking模型，并推出FP8版本及超大规模模型Qwen3-VL-235B-A22B的FP8版本。新模型以仅30亿激活参数，在STEM、视觉问答（VQA）、OCR、视频理解及智能体任务等领域媲美GPT-5-Mini和Claude4-Sonnet，部分表现更优。该模型具备更强的文本理解、视觉感知、空间推理及多模态处理能力，支持长达256K上下文（可扩展至1M），并优化了OCR功能与视觉代理能力。模型已在魔搭社区和Hugging Face免费开放下载，同时上线Qwen Chat，供开发者灵活部署与使用。

原文链接

蝶舞CyberSwirl

10-04 14:01:20

Qwen3-VL-30B-A3B

开源

视觉语言模型

分享至

打开微信扫一扫

内容投诉

生成图片

AIME’25满分炸场！Qwen一波七连发，全家桶大更新

2025年9月，阿里云在云栖大会上发布多项AI技术突破。新一代旗舰模型Qwen3-Max首次在AIME25和HMMT数学评测中拿下满分100分，参数量超万亿，分为指令版和思考版，性能全面提升。视觉模型Qwen3-VL重磅开源，在多项视觉感知评测中超越Gemini 2.5 Pro，并支持复杂视频理解。全模态模型Qwen3-Omni统一文本、图像、音频和视频，衍生出的Qwen3-LiveTranslate实现18种语言实时翻译，准确率领先行业。此外，Qwen3-Coder-Plus升级显著提升编程能力。阿里云智能集团CEO吴泳铭表示，AGI是起点，目标是发展超级人工智能（ASI）。同日，高效架构Qwen3-Next发布，激活3B参数即可媲美235B模型，训练成本降低超90%。

原文链接