正文:8月6日,小红书hi lab正式发布并开源首个多模态AI大模型dots.vlm1。该模型基于DeepSeek V3 LLM构建,配备从零训练的12亿参数视觉编码器NaViT,并支持动态分辨率和多种感知能力优化。通过引入多样化合成数据及图文交错网页数据重写,dots.vlm1在视觉感知与推理方面接近SOTA水平,在MMMU、MathVision等基准测试中表现优异,同时具备一定的文本推理能力。尽管部分细分任务仍有提升空间,其综合性能为开源多模态模型树立了新标杆。项目已开源。
原文链接
本文链接:https://kx.umi6.com/article/23131.html
转载请注明文章出处
相关推荐
换一换
小红书们,抢上搜索「末班车」
2024-05-07 16:48:11
钛媒体AGI独家
2025-02-21 10:45:51
小红书开源首个大模型 预训练未使用合成数据
2025-06-10 09:46:30
小红书,会是AI搜索的超级黑马吗
2025-01-09 21:03:38
小红书的野心藏不住了
2024-12-25 16:08:52
小红书首个多模态 AI 大模型 dots.vlm1 发布并开源,基于 DeepSeek V3 LLM
2025-08-06 19:35:57
谷歌新版Nano Banana上线
2025-11-20 21:46:39
小红书怎么一夜成为全世界网友都爱的翻译软件?
2025-01-20 21:24:11
小红书几天就搓出的翻译功能,到底是啥水平?
2025-01-21 08:32:43
AI文案正在攻占小红书
2024-07-17 21:19:54
小红书开源多模态大模型
2025-08-07 14:53:39
低调上线AI机器人达芬奇,吃喝玩乐小达人,小红书的未来就靠它了
2024-06-24 20:47:15
刚刚,小红书开源了首个多模态大模型dots.vlm1,性能直追SOTA!
2025-08-08 16:14:57
611 文章
369148 浏览
24小时热文
更多
-
2025-12-08 20:48:29 -
2025-12-08 20:47:34 -
2025-12-08 20:45:30