综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
10月1日,美国最大外卖平台DoorDash推出自主研发的配送机器人Dot。这款鲜红色机器人最高时速32km/h,可在马路、自行车道和人行道上自动行驶,用于运送餐食和小件包裹。Dot设计小巧灵活,货舱可装六个披萨或13kg食物,并配有LED屏、摄像头和AI导航系统。目前,Dot已在菲尼克斯都会区测试,计划2025年底前向当地160万居民开放服务。DoorDash联合创始人Stanley Tang称其结合灵活与高效,适合城市和郊区配送需求。未来,Dot还可能通过AI与顾客对话。尽管自动化推进,大部分订单仍由人类完成,而Dot将专注于提升效率和安全性。
原文链接
2025年8月8日,小红书开源了首个多模态大模型dots.vlm1,基于自研12亿参数视觉编码器和DeepSeek V3语言模型构建。该模型在视觉理解与推理任务中性能接近SOTA水平,可完成色盲图识别、数独解题、高考数学题解答等复杂任务,并能模仿李白诗风创作诗词。模型已在GitHub和HuggingFace平台开源,提供Demo供体验。这是小红书两个月内开源的第三款模型,体现了其技术自研的决心。团队强调多元智能研发方向,未来或将进一步结合图文生成能力与应用产品,推动更精准的内容理解和社区交互。
原文链接
8月7日,小红书hi lab宣布开源其dots模型家族中的首个视觉语言模型dots.vlm1。该模型基于12亿参数的视觉编码器和DeepSeek V3 LLM构建,经过大规模预训练与精调,在视觉感知和推理能力上达到接近行业领先水平(准SOTA)。这一开源项目有望推动多模态技术的发展,并为开发者提供更强大的工具支持。
原文链接
正文:8月6日,小红书hi lab正式发布并开源首个多模态AI大模型dots.vlm1。该模型基于DeepSeek V3 LLM构建,配备从零训练的12亿参数视觉编码器NaViT,并支持动态分辨率和多种感知能力优化。通过引入多样化合成数据及图文交错网页数据重写,dots.vlm1在视觉感知与推理方面接近SOTA水平,在MMMU、MathVision等基准测试中表现优异,同时具备一定的文本推理能力。尽管部分细分任务仍有提升空间,其综合性能为开源多模态模型树立了新标杆。项目已开源。
原文链接
前苹果设计师Jason Yuan打造的AI聊天应用“Dot”因其独特设计和功能引起了OpenAI的兴趣。这款iOS应用强调分享而非单纯聊天,通过优雅设计吸引用户,如太极般的Logo和简洁的界面。尽管Dot能主动了解用户、猜测性格并与用户建立连接,但其仍存在一些不足,如只能文字回复、响应速度较慢、联网搜索效率不高。作为一款重视长期记忆的产品,Dot通过卡片功能记录用户对话,呈现个人编年史,但免费版有限制,高级订阅提供更多功能。尽管有潜力成为用户的个性化伙伴,但隐私问题和用户对其数据处理的信任度是Dot面临的挑战。创始人强调,Dot并非替代真实人际关系,而是像一面镜子,帮助用户自我反思。整个产品引发了关于AI陪伴是孤独的补充还是情感连接的思考。
原文链接
加载更多
暂无内容