1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

AI版三个臭皮匠!ChatGPT/Gemini/DeepSeek合体拿下AGI测试最高分

ChatGPT的对话流畅性、Gemini的多模态能力、DeepSeek的长上下文分析……这些模型能否强强联合,共同解决问题?由Transformer作者之一Llion Jones创立的Sakana AI提出了一种新方法——AB-MCTS(自适应分支蒙特卡洛树搜索)。其核心思想是:最伟大的成就源于不同思想的协作,这一原则同样适用于AI。

AB-MCTS是一种让多个AI模型协同工作的算法。模型之间交换并完善建议,像人类团队一样合作。在ARC-AGI-2基准测试中,结合ChatGPT、Gemini和DeepSeek的AB-MCTS解决了30%的谜题,而顶尖独立模型仅解决23%。某些情况下,只有模型组合才能得出正确答案。

该算法结合了深度搜索(完善现有方案)和广度搜索(尝试全新方法),通过“无界分支”特性动态扩展搜索树。每个节点附带一个GEN子节点,用于生成新候选响应,同时利用贝叶斯后验预测分布和Thompson采样平衡探索与利用。Sakana AI还提出了两个变体:AB-MCTS-M(更分层,适合复杂任务)和AB-MCTS-A(更轻量,计算高效)。

实验表明,AB-MCTS在多种基准测试中表现优异。例如,在LiveCodeBench和CodeContest中,它在预算增加时显著优于基线方法;在挑战性极高的ARC-AGI测试中,AB-MCTS动态调整搜索范围,性能接近重复采样的强大基线。此外,AB-MCTS-M在MLE-Bench竞赛中表现出色,显示了其适应不同任务的能力。

这项研究灵感来源于自然界的进化与集体智能。Sakana AI此前开发了达尔文-哥德尔机(DGM),通过开放式搜索和自我修改生成解决方案。AB-MCTS正是基于这种“混合以使用”的理念,将现有强大AI模型的优势充分发挥。

论文与代码已开源,详情可见以下链接:
论文:https://arxiv.org/abs/2503.04412
算法(TreeQuest): https://github.com/SakanaAI/treequest
ARC-AGI实验:https://github.com/SakanaAI/ab-mcts-arc2

原文链接
本文链接:https://kx.umi6.com/article/21373.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
韩国延世大学曝大规模 AI 作弊丑闻,数百学生涉嫌用 ChatGPT 等参加考试
2025-11-10 16:24:47
ChatGPT内嵌App!OpenAI开发者日全览,Agent工具链+应用生态+模型API多箭齐发
2025-10-07 13:51:57
奥尔特曼称 ChatGPT 根除长破折号标点“顽疾”,用户可控 AI 输出风格
2025-11-15 15:57:34
全球 10% 成年人都在用:OpenAI、哈佛大学报告称 ChatGPT 月活用户已达 7 亿
2025-10-11 09:56:58
OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作
2025-10-14 11:16:47
OpenAI变现能力受质疑!ChatGPT欧洲付费用户增长已停滞
2025-10-17 18:27:50
AI最大赢家!研究预测:OpenAI将独揽AI市场1/4收入
2025-10-15 18:42:47
OpenAI 更新 ChatGPT 使用政策,禁止提供专业医疗、法律和财务建议
2025-11-02 19:37:44
多名用户状告美国联邦贸易委员会,称 ChatGPT 给自己造成严重心理伤害
2025-10-23 08:58:31
ChatGPT “记忆已满”不用愁,OpenAI 推出记忆自动管理功能
2025-10-16 12:54:51
ChatGPT三岁生日,谷歌却为它准备了「葬礼」
2025-12-02 16:24:22
ChatGPT 群聊功能上线部分地区:人机共同决策讨论、不会主动“打扰”你
2025-11-14 10:51:03
奥尔特曼计划全力强化ChatGPT竞争力 或推迟OpenAI广告业务
2025-12-02 19:34:10
24小时热文
更多
扫一扫体验小程序