1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月15日,阿里通义宣布Qwen3-VL系列新增4B与8B两款Dense架构视觉理解模型,并开源上线。Qwen3-VL-8B在STEM、VQA、OCR等任务中表现优异,超越Gemini 2.5 Flash Lite和GPT-5 Nano,接近上一代超大模型Qwen2.5-VL-72B的性能;4B版本则更适合端侧部署,性价比突出。两款模型通过技术优化解决了小模型常见的“跷跷板”问题,在文本稳健性与视觉精准性上实现协同突破。新模型已上线魔搭社区和Hugging Face,同时提供FP8版本,供开发者使用。

原文链接
本文链接:https://kx.umi6.com/article/26680.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
兑现承诺!马斯克旗下xAI宣布Grok 2.5正式开源
2025-08-25 16:33:11
不玩噱头的北京,用数据和实力成就「全球开源之都」
2025-05-20 20:44:53
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
2025-07-26 11:37:17
百度文心大模型4.5系列正式开源 同步开放API服务
2025-06-30 11:47:18
昆仑万维宣布开源 Matrix-Game 大模型:工业界首个开源的 10B+ 空间智能大模型,支持《我的世界》
2025-05-13 10:47:25
Hugging Face 公布 4.5 亿参数开源机器人模型 SmolVLA,消费级硬件设备即可运行
2025-06-09 18:33:05
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题
2025-05-30 15:52:41
DeepSeek开源新版R1 媲美OpenAI最高o3模型
2025-05-29 05:51:14
小扎改口不开源,Meta股价暴涨12%
2025-08-01 08:56:20
小米多模态大模型 MiMo-VL 开源,官方称多方面领先 Qwen2.5-VL-7B
2025-05-30 16:57:55
微软将开源 GitHub Copilot Chat 扩展,推动 VS Code 成开源 AI 编辑器
2025-05-20 15:43:49
开源Agent模型榜第一名,现在是阿里通义DeepResearch
2025-09-18 15:54:31
24小时热文
更多
扫一扫体验小程序