标题:自诩无所不知的大模型,能否拯救笨手笨脚的机器人?
从上海到纽约,全球餐厅里的机器人正忙碌地制作汉堡、披萨和炒菜,它们通过精准执行指令完成重复性工作。然而,南加州大学博士生Ishika Singh希望打造的是一种能真正“做晚饭”的机器人,它需具备常识、灵活性和应变能力,而这超出了传统编程的范畴。
问题的核心在于经典规划流程,它要求机器人学家提前定义每个动作及其前提和后果。即使编写数千行代码,机器人仍难以应对突发状况。一个理想的晚餐机器人需了解饮食文化、厨房布局、服务对象的需求,以及处理意外事件的能力。
Singh的导师Jesse Thomason指出,实现这一目标极具挑战性。尽管YouTube上展示了许多灵活的机器人视频,但它们的适应能力仍不及人类。传统机器人在受限环境中执行预设脚本,而现实世界的变化莫测使它们显得脆弱。
2022年,ChatGPT的出现为机器人注入了新的可能性。这款基于大语言模型(LLM)的工具能生成文本、模仿人类语言风格,几乎能解答任何烹饪问题。LLMs具备机器人欠缺的知识宝库,而机器人则能将语言模型的语义知识转化为实际行动。
然而,LLMs并非完美。它们容易出错、带有偏见且易受诱导。尽管如此,一些专家仍尝试结合LLMs与机器人,如Levatas公司的机器人能在特定工业环境中执行任务。但在更复杂的环境中,这些机器人仍显局限。
将LLMs接入机器人面临诸多挑战。一方面,机器人需处理物理世界中的随机性和不确定性;另一方面,LLMs的训练数据可能存在偏见。尽管如此,研究者正在探索将LLMs的常识与机器人实际操作相结合的方法,以突破现有技术瓶颈。
例如,Singh团队开发的ProgPrompt方法,通过示例指导LLM生成机器人可执行的Python代码,显著提高了任务成功率。此外,SayCan系统利用LLMs筛选适合的机器人行为,展现了高阶语义理解能力。
尽管如此,机器人语言理解与实际操作之间的鸿沟仍未完全弥合。如何确保LLMs的指令安全可靠,仍是未来研究的重要方向。
.png)

-
2025-07-21 19:24:29
-
2025-07-21 19:24:17
-
2025-07-21 19:23:25