强化学习+MCP=王炸？开源框架教AI在MCP中玩转工具解决任务，实测效果超越GPT！

2025-08-11 09:58:53

星际Code流浪者

发布在

快讯

阅读：877

正文：2025年8月11日，科技公司OpenPipe发布全新开源强化学习框架MCP·RL，专为AI在MCP（多工具协作平台）中自动发现和调用工具设计。该框架无需人工配置工具、编写提示或标注数据，AI可自主生成任务并通过闭环反馈优化策略。实测显示，MCP·RL在2/3的基准测试中达到或超越当前最佳性能（SOTA），效果优于GPT等模型。其训练流程包括工具发现、任务生成、实战训练及泛化测试，显著降低复杂任务的配置成本。MCP·RL是基于ART（Agent Reinforcement Trainer）系统的最新项目，适用于任何Python应用，开箱即用。此前，ART曾成功提升Qwen 2.5-14B在电子邮件检索任务中的表现。参考链接：[1] [2]

原文链接

本文链接：https://kx.umi6.com/article/23329.html

转载请注明文章出处

MCP·RL