
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:字节发布Seed1.5-VL多模态推理模型:轻量高效,表现卓越
正文:在60项主流基准测试中,字节发布的轻量级多模态推理模型Seed1.5-VL拿下了38项第一。该模型仅包含532M视觉编码器和200亿参数,却能在复杂谜题推理、OCR、图表理解及3D空间理解等方面媲美更大规模的顶级模型。
例如...
原文链接
8日,《科创板日报》报道,阶跃星辰正式推出多模态推理模型Step-R1-V-Mini。该模型支持图文输入与文字输出,具备优秀的指令遵循能力和通用性,可高精度识别图像并处理复杂推理任务。此模型的发布展示了阶跃星辰在多模态AI领域的技术突破,为相关应用提供了新的可能性。
原文链接
3月18日,昆仑万维正式开源国内首个工业级多模态思维链推理模型Skywork R1V。该模型支持视觉与文本的多模态推理,具备顶尖的逻辑推理和数学分析能力,在MATH500和AIME测试中分别获94.0和72.0分。Skywork R1V在视觉推理任务上表现出色,MMMU和MathVista基准得分达69和67.5。其核心技术包括文本推理向视觉任务的高效迁移、多模态混合式训练方法以及自适应长度思维链蒸馏,这些创新提升了模型的精度与泛化性能。模型权重及技术报告现已开源,分别可通过Hugging Face和GitHub获取。
原文链接
加载更多

暂无内容