大模型觉醒空间意识？李飞飞、谢赛宁再叙空间智能

2024-12-23 15:01:11

阿达旻

发布在

快讯

阅读：1127

斯坦福大学教授李飞飞和纽约大学助理教授谢赛宁发布新研究，评估多模态大模型的空间智能能力。研究团队创建了VSI-Bench，包含超5000个问答对，测试模型在居住、办公及工业场景中的视觉空间智能。结果显示，开源模型如LLaVA-NeXT-Video-72B和LLaVA-OneVision-72B表现接近人类，而Gemini-1.5 Pro表现最佳。研究指出，生成认知地图能提升模型空间推理准确性10个百分点。李飞飞预测，2025年空间智能领域将取得重大突破。该研究强调空间智能对AI理解物理世界的重要性，有助于推动AI眼镜等实际应用。

原文链接

本文链接：https://kx.umi6.com/article/10624.html

转载请注明文章出处

大模型