1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Pokee.ai 朱哲清:用 RL 打造通用智能体

在 Pokee.ai 内测之前,我们就感受到这款 Agent 的能力。“你发给我一个邮件就行,我的 Agent 能自动生成日程表。”这是朱哲清在电话会议中的开场白。他是知乎和小红书的活跃用户,也是强化学习领域的新星,团队在 2023 年 12 月开源了强化学习框架 Pearl,上线首日收获 540 星,如今已达 2.8k。

2016 年,AlphaGo 击败李世石时,还在杜克大学读书的朱哲清意识到 AI 正走向真实世界,从此成为强化学习的忠实信徒。在 Meta 时,他带领边缘化的 RL 团队,将强化学习应用于广告竞价、推荐系统和内容生成,每年为公司带来数亿美元收益。

尽管升至 Meta E7,朱哲清始终思考一个问题:是否有一种 RL 路径可以实现通用智能体?半年前,他离开 Meta,成为 Pokee.ai 创始人。创业不易,团队四人完成了模型架构、自动化、训练、部署及产品等工作,最终在 4 月底推出了内测版本。

《AI 产品十人谈》采访了朱哲清,探讨他对强化学习与 Agent 的思考。他坚信强化学习的优势在于目标驱动,而非单纯依赖预测。他的团队在 Meta 实现了每年 5 亿美元以上的收入增长,并探索了通用 RL 框架的可能性。

Pokee.ai 是一款强执行力的通用 AI Agent,不仅能生成内容,还能自动完成复杂任务,如内容创作、图片生成、格式适配及平台发布。其核心优势在于可扩展性和稳定性,无论工具数量如何增加,其响应成本几乎不变。未来,团队将开放 API 和 SDK,让开发者拥有专属 Agent。

朱哲清认为,下一代 Agent 不只是工具,而是能力系统。团队一方面开发早期产品,满足市场需求;另一方面专注于研究通用 RL 结构,追求真正的“具身智能体”。他们从电商场景入手,快速证明了技术可行性,并扩展到上千工具的调用能力,以验证 Agent 的普适性。

Pokee.ai 的架构基于自研的小型语言模型作为交互界面,而真正的决策逻辑和执行部分则由自研的强化学习结构完成。朱哲清认为,现有方法套用大模型外加 RL 层无法达到商用级别,因此团队重构系统,采用强化学习驱动的结构化决策。

他认为,未来不会有一个单一的 Super Agent,而是分层结构,顶层调度,各专业 Agent 分工合作。用户只需输入目标,Agent 体系自动完成任务。未来的互联网将是 Agent 交互为核心的新网络体系,浏览器这种前端形态可能被淘汰。

原文链接
本文链接:https://kx.umi6.com/article/18290.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
卡帕西:强化学习很糟糕,但其他所有方法都更糟
2025-10-18 15:34:39
波士顿动力 Spot 四足机器人学会连续后空翻,意外让行走姿态更像真实动物
2025-08-28 10:20:06
中国信通院正式启动2026年“可信AI-智能体”系列评估
2026-03-16 14:04:02
谷歌DeepMind:AI独立创造价值的经济层正在形成
2025-09-16 15:13:08
硅谷最新调研:2026年,AI Agent到底会走向哪?
2026-01-30 13:30:51
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
2025-09-26 11:24:15
微软CEO称该公司计划于周五发布新的智能体AI模型
2025-12-11 13:53:32
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026
2026-02-24 14:48:42
手机端侧AI轻量化演进:3B模型渐成主流 智能体标准亟待完善
2025-10-11 13:30:31
ISC.AI 2025创新百强颁奖典礼落幕,首发智能体专家驱动产业升级
2025-12-18 12:41:46
Kimi K2 Thinking突袭!智能体&推理能力超GPT-5,网友:再次缩小开源闭源差距
2025-11-07 10:43:45
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
「斯坦福AI小镇」创业即获投1亿美元!李飞飞卡帕西都投了
2026-02-14 17:33:09
24小时热文
更多
扫一扫体验小程序