正文:2025年8月11日,科技公司OpenPipe发布全新开源强化学习框架MCP·RL,专为AI在MCP(多工具协作平台)中自动发现和调用工具设计。该框架无需人工配置工具、编写提示或标注数据,AI可自主生成任务并通过闭环反馈优化策略。实测显示,MCP·RL在2/3的基准测试中达到或超越当前最佳性能(SOTA),效果优于GPT等模型。其训练流程包括工具发现、任务生成、实战训练及泛化测试,显著降低复杂任务的配置成本。MCP·RL是基于ART(Agent Reinforcement Trainer)系统的最新项目,适用于任何Python应用,开箱即用。此前,ART曾成功提升Qwen 2.5-14B在电子邮件检索任务中的表现。参考链接:[1] [2]
原文链接
本文链接:https://kx.umi6.com/article/23329.html
转载请注明文章出处
相关推荐
换一换
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
2025-10-20 16:09:01
腾讯宣布开源 Youtu-GraphRAG 框架,解决图检索增强技术难题
2025-09-13 10:24:35
机器狗能当羽毛球搭子了!仅靠强化学习从0自学,还涌现出类人回位行为 | Science子刊
2025-05-30 16:56:50
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026
2026-02-24 14:48:42
蚂蚁开源 Ring-1T,成就推理、编程、通用智能三冠王
2025-10-24 11:36:00
Meta 推 LlamaRL 强化学习框架:全异步分布设计,训练 AI 模型提速 10.7 倍
2025-06-11 16:14:21
亚马逊开建AGI实验室,一号位也是华人
2025-09-22 09:54:37
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
2025-06-05 15:52:55
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
2025-07-01 15:26:33
西交大 x A*STAR 论文:让 AI 学会「保持一致」,多图生成迎来关键突破丨CVPR 2026
2026-03-24 11:45:18
AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
2025-04-09 21:08:08
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
论文秒变海报!开源框架PosterAgent一键生成顶会级学术Poster
2025-06-03 17:59:46
723 文章
583768 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38