
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
新的Benchmark Video-Holmes让大模型在复杂视频推理中全部不及格。这项由腾讯ARC Lab和香港城市大学合作推出的研究,被称为视频推理界的“福尔摩斯测试”。它通过复杂的推理任务,如“找出凶手”或“解析作案意图”,揭示了现有大模型在视频推理能力上的局限性。
传统视频推理基准往往过于简...
原文链接
加载更多

暂无内容