1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:UCLA与谷歌联手打造AI新突破:长时记忆+3D空间理解超越基线16.5%

正文:

想象一下,在一个陌生的房子里寻找适合的礼物盒包装泰迪熊,这需要记住每个房间的物品特征、位置关系,并根据反馈调整行动。这一过程依赖于人类强大的空间-时间长时记忆。

加州大学洛杉矶分校(UCLA)与谷歌研究院的研究团队带来最新进展:3DLLM-MEM模型和3DMEM-BENCH基准,使AI首次具备在复杂3D环境中构建、维护和利用长时记忆的能力。

现有大语言模型在文本理解中表现优秀,但在动态3D环境中面临挑战,主要问题包括长时记忆断层、空间表征缺失及时空动态管理不足。这些问题阻碍了AI形成类似人类的认知地图并灵活调用记忆。

为解决这些问题,研究团队开发了3DMEM-BENCH基准,包含26,000+轨迹和1,860个具身任务,覆盖182个3D场景。该基准提供了大规模、多样化的评估,涵盖具身任务、时空问答及场景描述等多个维度,并设有难度分级。

同时,团队提出了3DLLM-MEM模型,采用双记忆架构:工作记忆负责短期动态更新,情景记忆则以密集3D表征存储历史信息。通过记忆融合模块和动态更新机制,模型实现了高效的任务执行与记忆管理。

实验结果显示,3DLLM-MEM在具身任务成功率、时空推理能力和记忆效率方面均显著优于现有方法,特别是在“野外困难任务”中成功率达到27.8%,整体成功率比最强基线高出16.5%。

尽管取得重要进展,研究团队仍指出模型需进一步整合底层导航与控制功能。论文链接和项目主页已公开供参考。

原文链接
本文链接:https://kx.umi6.com/article/19712.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%
2025-06-04 17:30:05
2025AI消费电子大会10月深圳启幕!AI重新定义消费体验!
2025-07-21 19:20:53
我国网民规模已达11.23亿人 互联网普及率达79.7%
2025-07-21 10:17:44
多模态都是假的:最强模型数不清手指、认不出雷碧
2025-07-22 15:38:55
WAIC前瞻:多厂商智能体产品首发首秀 Agent迎发布潮
2025-07-21 16:21:09
美AI“星际之门”被曝受阻 年底前只建一小数据中心
2025-07-22 17:37:59
苏州首个AI数据标注基地投产
2025-07-21 19:24:29
字节跳动发布通用机器人模型GR-3
2025-07-22 12:32:35
OpenAI拿IMO金牌火了,为何大批人却怒了?
2025-07-22 10:30:21
国家数据局:推进数据要素市场化配置改革和“人工智能+”行动同向发力 同频共振
2025-07-22 14:37:12
从漂泊少年到AI帝国掌舵者,黄仁勋为何能铸造英伟达传奇?
2025-07-21 21:25:24
继 OpenAI 之后,谷歌宣布其 Gemini AI 在国际数学奥林匹克竞赛测试中获金牌水平成绩
2025-07-22 16:34:56
知名AI初创公司Anthropic扬言:Meta“天价招聘”奈何不了我
2025-07-21 17:23:59
24小时热文
更多
扫一扫体验小程序