MCP·RL - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

强化学习+MCP=王炸？开源框架教AI在MCP中玩转工具解决任务，实测效果超越GPT！

正文：2025年8月11日，科技公司OpenPipe发布全新开源强化学习框架MCP·RL，专为AI在MCP（多工具协作平台）中自动发现和调用工具设计。该框架无需人工配置工具、编写提示或标注数据，AI可自主生成任务并通过闭环反馈优化策略。实测显示，MCP·RL在2/3的基准测试中达到或超越当前最佳性能（SOTA），效果优于GPT等模型。其训练流程包括工具发现、任务生成、实战训练及泛化测试，显著降低复杂任务的配置成本。MCP·RL是基于ART（Agent Reinforcement Trainer）系统的最新项目，适用于任何Python应用，开箱即用。此前，ART曾成功提升Qwen 2.5-14B在电子邮件检索任务中的表现。参考链接：[1] [2]

原文链接