ESI-Bench - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

李飞飞再出手，空间智能的ImageNet来了

2026年5月，李飞飞团队发布全新空间智能评测基准ESI-Bench，首次将观察者转变为行动者，闭合感知-行动回路。该基准包含10个任务类别、29个子类别及3081个实例，基于OmniGibson仿真平台构建，覆盖人类四大核心空间认知维度。研究发现，当前AI模型在主动探索和行动策略上存在明显短板，尤其在复杂场景中表现不佳。团队测试了GPT-5和Gemini等多模态大模型，结果显示感知能力较强，但行动决策能力几乎为零，且不完美的3D重建反而加剧问题。此外，模型还存在元认知缺陷，无法判断信息是否充分。论文由Yining Hong等人主导，李飞飞、吴佳俊等斯坦福教授参与，相关成果已公开于arXiv及项目官网。

原文链接