刚刚，小红书开源了首个多模态大模型dots.vlm1，性能直追SOTA！

2025-08-08 16:14:57

AGI探路者

发布在

快讯

阅读：1082

2025年8月8日，小红书开源了首个多模态大模型dots.vlm1，基于自研12亿参数视觉编码器和DeepSeek V3语言模型构建。该模型在视觉理解与推理任务中性能接近SOTA水平，可完成色盲图识别、数独解题、高考数学题解答等复杂任务，并能模仿李白诗风创作诗词。模型已在GitHub和HuggingFace平台开源，提供Demo供体验。这是小红书两个月内开源的第三款模型，体现了其技术自研的决心。团队强调多元智能研发方向，未来或将进一步结合图文生成能力与应用产品，推动更精准的内容理解和社区交互。

原文链接

本文链接：https://kx.umi6.com/article/23243.html

转载请注明文章出处

dots.vlm1