标题:我不给人做产品,给Agent做
曲凯问雷磊,Agent热潮由Manus带动,下一个热点可能在哪里?雷磊认为是Agent Infra。他提到,未来Agent数量会大幅增加,成为数字员工,需为它们重构互联网基础设施。
Agent与人类协作方式不同。交互上,人类依赖视觉,而Agent可通过文本和多模态后端交互。学习方式上,人类无法同时做事和学习,但Agent能通过强化学习边执行边学,因此需要设计奖励机制。
此外,Agent支持多线程任务,而人类按流程单线程工作。责任界定也是问题,AI行为需有“安全围栏”控制影响范围。
雷磊以E2B为例,解释其提供安全沙盒环境。他认为云厂商和Agent Infra公司应合作,共同拓展市场。
Browserbase等产品为AI优化浏览器,云端运行,无前端界面,自动处理账号密码等敏感信息。Grasp则在Runtime层基础上加入Agentic层,提升AI与网页的交互能力。
Agent Infra包括环境(如Coding、Browser)和工具(如身份、支付)。未来随着Multi Agent成熟,还需考虑协作与管理。
雷磊认为,AI通过反馈循环自主迭代比依赖人类知识更重要。他提到AlphaProof通过强化学习获得奥数银牌,说明AI可自主探索。
最后,他建议关注Agent崛起时如何提前布局,而非纠结何时到来。当前AI访问网站流量仅0.1%,未来可能增长10倍,机会巨大。
原文链接
本文链接:https://kx.umi6.com/article/20931.html
转载请注明文章出处
相关推荐
换一换
大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题
2025-04-02 17:34:52
Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了
2025-08-26 13:43:07
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
2025-08-11 09:58:53
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B
2025-07-20 15:05:31
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
2025-10-23 17:10:54
Thinking Machine新研究刷屏!结合RL+微调,小模型训练更具性价比
2025-10-28 10:41:47
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
2025-10-30 10:33:49
蚂蚁开源 Ring-1T,成就推理、编程、通用智能三冠王
2025-10-24 11:36:00
卡帕西:强化学习很糟糕,但其他所有方法都更糟
2025-10-18 15:34:39
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
2025-10-05 20:24:55
AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
2025-04-09 21:08:08
拒绝“概念”要“实效”:百度智能云详解Agent Infra如何让智能体成为真正生产力
2025-11-17 20:39:52
688 文章
486166 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18