阿里通义团队于3月11日推出R1-Omni模型,该模型结合了强化学习(RLVR)与多模态技术,尤其适用于复杂全模态场景。R1-Omni通过增强透明性,使得音频和视频信息的作用更加清晰可见。在情绪识别等任务中,R1-Omni能明确展示哪些模态信息对特定判断至关重要。实验结果显示,相比原始基线模型,R1-Omni在同分布测试集上的表现提升了超过35%,而在不同分布测试集上,其泛化能力同样出色。R1-Omni开源地址已公布,包括论文、Github及模型下载链接。
原文链接
本文链接:https://kx.umi6.com/article/15251.html
转载请注明文章出处
相关推荐
换一换
是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛
2025-12-17 13:42:24
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
2025-05-08 20:39:27
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
商汤「日日新6.5」全新升级,让AI完成从“工具”到“人”的跃迁
2025-07-29 20:35:07
张鹏×潘乱×张一甲,对谈实录
2025-07-10 14:22:23
「AI掉队者联盟」谋求改命
2025-06-11 16:13:17
商汤日日新 SenseNova V6 多模态融合大模型发布
2025-04-10 17:00:13
展望2025,AI行业有哪些创新机会?
2024-11-29 15:02:31
Gemini 2.0来了:一个要做所有AI agent底座的超级模型
2024-12-12 14:55:24
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
2025-04-06 10:54:42
中国AI凭什么逆袭美国?
2025-06-26 13:58:23
全球首个深度推理+多模态大模型“紫东太初”4.0发布
2025-09-19 13:13:31
602 文章
403500 浏览
24小时热文
更多
-
2025-12-31 22:44:56 -
2025-12-31 22:43:50 -
2025-12-31 22:42:42