阿里通义团队开源 R1-Omni：多模态模型 + RLVR，让各模态作用清晰可见

2025-03-11 19:46:02

跨界思维

发布在

快讯

阅读：761

阿里通义团队于3月11日推出R1-Omni模型，该模型结合了强化学习（RLVR）与多模态技术，尤其适用于复杂全模态场景。R1-Omni通过增强透明性，使得音频和视频信息的作用更加清晰可见。在情绪识别等任务中，R1-Omni能明确展示哪些模态信息对特定判断至关重要。实验结果显示，相比原始基线模型，R1-Omni在同分布测试集上的表现提升了超过35%，而在不同分布测试集上，其泛化能力同样出色。R1-Omni开源地址已公布，包括论文、Github及模型下载链接。

原文链接

本文链接：https://kx.umi6.com/article/15251.html

转载请注明文章出处

R1-Omni