1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

AI版三个臭皮匠!ChatGPT/Gemini/DeepSeek合体拿下AGI测试最高分

ChatGPT的对话流畅性、Gemini的多模态能力、DeepSeek的长上下文分析……这些模型能否强强联合,共同解决问题?由Transformer作者之一Llion Jones创立的Sakana AI提出了一种新方法——AB-MCTS(自适应分支蒙特卡洛树搜索)。其核心思想是:最伟大的成就源于不同思想的协作,这一原则同样适用于AI。

AB-MCTS是一种让多个AI模型协同工作的算法。模型之间交换并完善建议,像人类团队一样合作。在ARC-AGI-2基准测试中,结合ChatGPT、Gemini和DeepSeek的AB-MCTS解决了30%的谜题,而顶尖独立模型仅解决23%。某些情况下,只有模型组合才能得出正确答案。

该算法结合了深度搜索(完善现有方案)和广度搜索(尝试全新方法),通过“无界分支”特性动态扩展搜索树。每个节点附带一个GEN子节点,用于生成新候选响应,同时利用贝叶斯后验预测分布和Thompson采样平衡探索与利用。Sakana AI还提出了两个变体:AB-MCTS-M(更分层,适合复杂任务)和AB-MCTS-A(更轻量,计算高效)。

实验表明,AB-MCTS在多种基准测试中表现优异。例如,在LiveCodeBench和CodeContest中,它在预算增加时显著优于基线方法;在挑战性极高的ARC-AGI测试中,AB-MCTS动态调整搜索范围,性能接近重复采样的强大基线。此外,AB-MCTS-M在MLE-Bench竞赛中表现出色,显示了其适应不同任务的能力。

这项研究灵感来源于自然界的进化与集体智能。Sakana AI此前开发了达尔文-哥德尔机(DGM),通过开放式搜索和自我修改生成解决方案。AB-MCTS正是基于这种“混合以使用”的理念,将现有强大AI模型的优势充分发挥。

论文与代码已开源,详情可见以下链接:
论文:https://arxiv.org/abs/2503.04412
算法(TreeQuest): https://github.com/SakanaAI/treequest
ARC-AGI实验:https://github.com/SakanaAI/ab-mcts-arc2

原文链接
本文链接:https://kx.umi6.com/article/21373.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 前瞻 ChatGPT 终极形态:迈步“App Store”时代,搭积木式创建 AI 智能体
2025-10-07 07:46:59
OpenAI的前世今生
2025-08-27 10:01:51
ChatGPT “记忆已满”不用愁,OpenAI 推出记忆自动管理功能
2025-10-16 12:54:51
ChatGPT推出新功能:基于聊天历史推送个性化每日资讯
2025-09-26 02:15:31
OpenAI 推出 ChatGPT 家长控制功能,可限制使用时间、减少敏感内容等
2025-09-29 19:15:14
OpenAI正在调查ChatGPT无法显示回复的问题
2025-09-03 16:50:01
能否让悲剧不再重演?OpenAI 下月为 ChatGPT 添加家长控制功能,自动干预风险对话
2025-09-03 09:43:47
全球 10% 成年人都在用:OpenAI、哈佛大学报告称 ChatGPT 月活用户已达 7 亿
2025-10-11 09:56:58
奥尔特曼:有人怀念“舔狗”式 ChatGPT,因为他们从未被人肯定过
2025-08-08 21:19:20
因提供自杀建议被起诉 OpenAI紧急加强安全防护措施
2025-08-27 22:08:50
ChatGPT 后遗症:佛罗里达州立大学研究称人类日常聊天越来越“AI 化”
2025-08-28 16:26:19
GPT-6 或将比 GPT-5 强 10 倍!奥尔特曼揭秘 ChatGPT 如何诞生
2025-10-05 20:26:06
ChatGPT负责人深度复盘:我们做错了什么?
2025-08-19 22:05:24
24小时热文
更多
扫一扫体验小程序