标题:伯克利具身智能图谱:深度强化学习浪尖上的中国90后们
作者 | 赖文昕 编辑 | 陈彩娴
短短一年内,边塞科技、星动纪元、星海图和千寻智能相继成立,跻身国内明星创企之列;大洋彼岸,Covariant 和 Anyware Robotics 也正在湾区闪耀。六家公司,八位90后创始人,他们都成长于深度强化学习的摇篮。
2016年春,伯克利计算机系的前沿课程首次探讨深度强化学习。吴翼、高阳、段岩和陈曦在课堂相遇。Pieter Abbeel 和 Sergey Levine 讲授最新研究成果,课程涵盖TRPO、DQN等算法。吴翼通过不断提问和与段岩、陈曦的学习,逐渐掌握了深度强化学习框架RLLib。
吴翼在博士期间转向深度强化学习,导师 Stuart Russell 更倾向于贝叶斯推理和逻辑推理。吴翼选择了兼顾导师课题与个人兴趣的研究方向。在2015年圣诞假期后,他向 Pieter Abbeel 提出做深度强化学习项目,最终发表了第一篇论文并获得NIPS 2016最佳论文奖。
段岩和陈曦在Pieter Abbeel组内,也是伯克利深度强化学习浪潮的先驱。段岩和陈曦在2015年创立Sellegit后不久回归伯克利,随后在OpenAI研究深度学习和强化学习。段岩提出结合元学习与深度强化学习,提出了RL²算法,尽管初期未被认可,但该算法推动了深度强化学习的发展。
高阳和许华哲也从伯克利博士毕业后回国任教。高阳在清华大学开设了计算机视觉与机器人结合的课程,致力于强化学习在机器人领域的应用。许华哲在斯坦福研究机器人捏橡皮泥等任务后,回国创立星海图,专注于轮式+双臂的具身智能方案。
陈建宇在伯克利转向强化学习和自动驾驶研究,回国后加入清华大学,探索多种形态机器人。他创立星动纪元,专注于人形机器人和复杂地形行走技术。
汤特在发那科先端研究所锻炼后,创立Anyware Robotics,专注于重型通用机器人,应用于物流和生产场景。罗剑岚则在谷歌和伯克利之间往返,最终回到伯克利研究强化学习在真实世界的应用。
这些年轻的创业者们从伯克利深度强化学习课堂起步,逐渐将研究转向具身智能,推动了AI与机器人技术的融合与发展。
-
2026-04-13 22:23:19 -
2026-04-13 22:22:15 -
2026-04-13 21:20:05