正文:8月6日,小红书hi lab正式发布并开源首个多模态AI大模型dots.vlm1。该模型基于DeepSeek V3 LLM构建,配备从零训练的12亿参数视觉编码器NaViT,并支持动态分辨率和多种感知能力优化。通过引入多样化合成数据及图文交错网页数据重写,dots.vlm1在视觉感知与推理方面接近SOTA水平,在MMMU、MathVision等基准测试中表现优异,同时具备一定的文本推理能力。尽管部分细分任务仍有提升空间,其综合性能为开源多模态模型树立了新标杆。项目已开源。
原文链接
本文链接:https://kx.umi6.com/article/23131.html
转载请注明文章出处
相关推荐
换一换
小红书首次公开AI技术体系,为最大规模校招拼了
2025-09-18 16:55:24
AI文案正在攻占小红书
2024-07-17 21:19:54
小红书的野心藏不住了
2024-12-25 16:08:52
小红书开放内测长文功能:标题限20字内 正文可输入千字以上
2025-07-04 19:49:53
小红书们,抢上搜索「末班车」
2024-05-07 16:48:11
AI金矿上打盹的小红书,刚刚醒了一「点点」
2025-12-26 17:50:45
AI会改变知乎和小红书吗?
2025-03-25 14:58:52
Mistral 发布 Pixtral Large 多模态 AI 模型:登顶复杂数学推理,图表 / 文档推理超过 GPT-4o
2024-11-19 15:47:33
小红书首个多模态 AI 大模型 dots.vlm1 发布并开源,基于 DeepSeek V3 LLM
2025-08-06 19:35:57
小红书开源多模态大模型
2025-08-07 14:53:39
小红书据称获风投公司DST Global投资 公司暂无回应;软银收购英国人工智能芯片制造商Graphcore|AI daily早新闻
2024-07-12 10:11:56
小红书怎么用大模型?顶会作者在线等你来聊
2024-06-24 18:05:47
装修帖里的完美夫妻竟是AI生成 小红书回应:会加强技术识别
2025-12-16 10:34:37
665 文章
456798 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29