综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年5月,李飞飞团队发布全新空间智能评测基准ESI-Bench,首次将观察者转变为行动者,闭合感知-行动回路。该基准包含10个任务类别、29个子类别及3081个实例,基于OmniGibson仿真平台构建,覆盖人类四大核心空间认知维度。研究发现,当前AI模型在主动探索和行动策略上存在明显短板,尤其在复杂场景中表现不佳。团队测试了GPT-5和Gemini等多模态大模型,结果显示感知能力较强,但行动决策能力几乎为零,且不完美的3D重建反而加剧问题。此外,模型还存在元认知缺陷,无法判断信息是否充分。论文由Yining Hong等人主导,李飞飞、吴佳俊等斯坦福教授参与,相关成果已公开于arXiv及项目官网。
原文链接
加载更多
暂无内容