综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
10月4日,华为宣布昇腾0day支持阿里云通义千问Qwen3-VL-30B-A3B模型适配。该模型在视觉理解方面显著提升,同时保持强大文本处理能力。主要功能包括视觉代理、增强的视觉编码、高级空间感知、长上下文与视频理解等。此外,扩展的OCR支持32种语言,文本-视觉融合实现无损理解。此次适配延续了昇腾对Qwen系列的支持,新模型发布后即在LLaMA Factory和vLLM中开箱可用。此前,9月29日发布的DeepSeek-V3.2-Exp也实现0day支持,并开源推理代码与算子实现。
原文链接
10月4日,阿里云通义千问宣布开源Qwen3-VL-30B-A3B-Instruct与Thinking模型,并推出FP8版本及超大规模模型Qwen3-VL-235B-A22B的FP8版本。新模型以仅30亿激活参数,在STEM、视觉问答(VQA)、OCR、视频理解及智能体任务等领域媲美GPT-5-Mini和Claude4-Sonnet,部分表现更优。该模型具备更强的文本理解、视觉感知、空间推理及多模态处理能力,支持长达256K上下文(可扩展至1M),并优化了OCR功能与视觉代理能力。模型已在魔搭社区和Hugging Face免费开放下载,同时上线Qwen Chat,供开发者灵活部署与使用。
原文链接
加载更多
暂无内容