1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

AI版三个臭皮匠!ChatGPT/Gemini/DeepSeek合体拿下AGI测试最高分

ChatGPT的对话流畅性、Gemini的多模态能力、DeepSeek的长上下文分析……这些模型能否强强联合,共同解决问题?由Transformer作者之一Llion Jones创立的Sakana AI提出了一种新方法——AB-MCTS(自适应分支蒙特卡洛树搜索)。其核心思想是:最伟大的成就源于不同思想的协作,这一原则同样适用于AI。

AB-MCTS是一种让多个AI模型协同工作的算法。模型之间交换并完善建议,像人类团队一样合作。在ARC-AGI-2基准测试中,结合ChatGPT、Gemini和DeepSeek的AB-MCTS解决了30%的谜题,而顶尖独立模型仅解决23%。某些情况下,只有模型组合才能得出正确答案。

该算法结合了深度搜索(完善现有方案)和广度搜索(尝试全新方法),通过“无界分支”特性动态扩展搜索树。每个节点附带一个GEN子节点,用于生成新候选响应,同时利用贝叶斯后验预测分布和Thompson采样平衡探索与利用。Sakana AI还提出了两个变体:AB-MCTS-M(更分层,适合复杂任务)和AB-MCTS-A(更轻量,计算高效)。

实验表明,AB-MCTS在多种基准测试中表现优异。例如,在LiveCodeBench和CodeContest中,它在预算增加时显著优于基线方法;在挑战性极高的ARC-AGI测试中,AB-MCTS动态调整搜索范围,性能接近重复采样的强大基线。此外,AB-MCTS-M在MLE-Bench竞赛中表现出色,显示了其适应不同任务的能力。

这项研究灵感来源于自然界的进化与集体智能。Sakana AI此前开发了达尔文-哥德尔机(DGM),通过开放式搜索和自我修改生成解决方案。AB-MCTS正是基于这种“混合以使用”的理念,将现有强大AI模型的优势充分发挥。

论文与代码已开源,详情可见以下链接:
论文:https://arxiv.org/abs/2503.04412
算法(TreeQuest): https://github.com/SakanaAI/treequest
ARC-AGI实验:https://github.com/SakanaAI/ab-mcts-arc2

原文链接
本文链接:https://kx.umi6.com/article/21373.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 公布“青少年安全蓝图”,ChatGPT 将推新功能自动判断用户是否成年
2025-11-08 00:15:40
OpenAI:全球每天有超过 4000 万人使用 ChatGPT 获取健康信息
2026-01-05 23:31:23
不只是效率工具!数据揭露扎心真相:年轻人把AI当成情感树洞
2026-02-25 19:48:45
ChatGPT 内测“群聊”功能,OpenAI 计划推出“共享项目”模式
2025-11-12 15:09:40
OpenAI 宣布:苹果 Apple Music 即将与 ChatGPT 集成
2025-12-17 07:23:18
AI风向突变?赛富时CEO:准备弃用ChatGPT,谷歌Gemini 3已完全超越!
2025-11-25 15:57:21
谷歌凭啥让 OpenAI 紧张?Gemini 和 ChatGPT 流量一升一降
2026-01-07 19:24:37
ChatGPT成人模式最快明年一季度上线!正测试年龄验证
2025-12-15 00:06:58
OpenAI:预计ChatGPT五年内付费用户将达2.2亿
2025-11-26 15:50:50
OpenAI准备在本周推出更新版聊天模型
2026-02-09 21:33:55
韩国 AI 订阅支出已超过 Netflix,ChatGPT 市场份额遥遥领先
2026-01-18 23:48:12
OpenAI的「红色警报」
2025-12-03 14:21:25
OpenAI 推出教育版 ChatGPT,2027 年 6 月前对美国 K - 12 教师免费
2025-11-20 21:42:05
24小时热文
更多
扫一扫体验小程序