10月15日,阿里通义宣布Qwen3-VL系列新增4B与8B两款Dense架构视觉理解模型,并开源上线。Qwen3-VL-8B在STEM、VQA、OCR等任务中表现优异,超越Gemini 2.5 Flash Lite和GPT-5 Nano,接近上一代超大模型Qwen2.5-VL-72B的性能;4B版本则更适合端侧部署,性价比突出。两款模型通过技术优化解决了小模型常见的“跷跷板”问题,在文本稳健性与视觉精准性上实现协同突破。新模型已上线魔搭社区和Hugging Face,同时提供FP8版本,供开发者使用。
原文链接
本文链接:https://kx.umi6.com/article/26680.html
转载请注明文章出处
相关推荐
换一换
阿里开源视觉理解模型Qwen3-VL
2025-09-24 14:43:41
英伟达开源9B参数小模型,比Qwen3快6倍
2025-08-19 16:03:42
AIME’25满分炸场!Qwen一波七连发,全家桶大更新
2025-09-24 15:41:51
阿里通义 Qwen3-VL 新增 2B、32B 两个密集模型尺寸,手机也能跑
2025-10-22 14:45:02
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
阶跃星辰全面开源 Step 3.5 Flash:预训练+训练框架全放出 冲上 OpenClaw Top2
2026-03-04 10:34:06
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
企业级OpenClaw最强拍档来了!万亿参数的国产多模态大模型,刚刚开源发布
2026-03-05 19:45:14
小扎改口不开源,Meta股价暴涨12%
2025-08-01 08:56:20
小米首席语音科学家 Daniel Povey:AI 发展的本质就像生物进化,不开源要慢 1000 倍
2025-12-15 16:49:04
腾讯混元图像3.0图生图开源,LMArena跻身全球第一梯队,开源最强
2026-01-28 17:26:24
外滩大会今年太AI了!王坚暴论:OpenAI确实站在了历史错误的一边
2025-09-12 12:10:41
648 文章
442726 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22