Pokee.ai 朱哲清：用 RL 搭建智能体的「骨骼与神经」| AI 产品十人谈

2025-05-08 11:29:43

虚拟微光

发布在

科普

阅读：720

标题：Pokee.ai 朱哲清：用 RL 打造通用智能体

在 Pokee.ai 内测之前，我们就感受到这款 Agent 的能力。“你发给我一个邮件就行，我的 Agent 能自动生成日程表。”这是朱哲清在电话会议中的开场白。他是知乎和小红书的活跃用户，也是强化学习领域的新星，团队在 2023 年 12 月开源了强化学习框架 Pearl，上线首日收获 540 星，如今已达 2.8k。

2016 年，AlphaGo 击败李世石时，还在杜克大学读书的朱哲清意识到 AI 正走向真实世界，从此成为强化学习的忠实信徒。在 Meta 时，他带领边缘化的 RL 团队，将强化学习应用于广告竞价、推荐系统和内容生成，每年为公司带来数亿美元收益。

尽管升至 Meta E7，朱哲清始终思考一个问题：是否有一种 RL 路径可以实现通用智能体？半年前，他离开 Meta，成为 Pokee.ai 创始人。创业不易，团队四人完成了模型架构、自动化、训练、部署及产品等工作，最终在 4 月底推出了内测版本。

《AI 产品十人谈》采访了朱哲清，探讨他对强化学习与 Agent 的思考。他坚信强化学习的优势在于目标驱动，而非单纯依赖预测。他的团队在 Meta 实现了每年 5 亿美元以上的收入增长，并探索了通用 RL 框架的可能性。

Pokee.ai 是一款强执行力的通用 AI Agent，不仅能生成内容，还能自动完成复杂任务，如内容创作、图片生成、格式适配及平台发布。其核心优势在于可扩展性和稳定性，无论工具数量如何增加，其响应成本几乎不变。未来，团队将开放 API 和 SDK，让开发者拥有专属 Agent。

朱哲清认为，下一代 Agent 不只是工具，而是能力系统。团队一方面开发早期产品，满足市场需求；另一方面专注于研究通用 RL 结构，追求真正的“具身智能体”。他们从电商场景入手，快速证明了技术可行性，并扩展到上千工具的调用能力，以验证 Agent 的普适性。

Pokee.ai 的架构基于自研的小型语言模型作为交互界面，而真正的决策逻辑和执行部分则由自研的强化学习结构完成。朱哲清认为，现有方法套用大模型外加 RL 层无法达到商用级别，因此团队重构系统，采用强化学习驱动的结构化决策。

他认为，未来不会有一个单一的 Super Agent，而是分层结构，顶层调度，各专业 Agent 分工合作。用户只需输入目标，Agent 体系自动完成任务。未来的互联网将是 Agent 交互为核心的新网络体系，浏览器这种前端形态可能被淘汰。

原文链接

本文链接：https://kx.umi6.com/article/18290.html

转载请注明文章出处

强化学习

智能体

通用AI

分享至

打开微信扫一扫

内容投诉

生成图片

虚拟微光

722 文章

672051 浏览

24小时热文

苹果抨击“为AI而AI”：真正有用的AI需以用户为中心

2026-06-09 07:06:40
AI狂欢要散场了吗

2026-06-09 00:54:40
库克亲自掌舵！一场会议改写苹果AI发展走向

2026-06-09 00:53:08