1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

AI版三个臭皮匠!ChatGPT/Gemini/DeepSeek合体拿下AGI测试最高分

ChatGPT的对话流畅性、Gemini的多模态能力、DeepSeek的长上下文分析……这些模型能否强强联合,共同解决问题?由Transformer作者之一Llion Jones创立的Sakana AI提出了一种新方法——AB-MCTS(自适应分支蒙特卡洛树搜索)。其核心思想是:最伟大的成就源于不同思想的协作,这一原则同样适用于AI。

AB-MCTS是一种让多个AI模型协同工作的算法。模型之间交换并完善建议,像人类团队一样合作。在ARC-AGI-2基准测试中,结合ChatGPT、Gemini和DeepSeek的AB-MCTS解决了30%的谜题,而顶尖独立模型仅解决23%。某些情况下,只有模型组合才能得出正确答案。

该算法结合了深度搜索(完善现有方案)和广度搜索(尝试全新方法),通过“无界分支”特性动态扩展搜索树。每个节点附带一个GEN子节点,用于生成新候选响应,同时利用贝叶斯后验预测分布和Thompson采样平衡探索与利用。Sakana AI还提出了两个变体:AB-MCTS-M(更分层,适合复杂任务)和AB-MCTS-A(更轻量,计算高效)。

实验表明,AB-MCTS在多种基准测试中表现优异。例如,在LiveCodeBench和CodeContest中,它在预算增加时显著优于基线方法;在挑战性极高的ARC-AGI测试中,AB-MCTS动态调整搜索范围,性能接近重复采样的强大基线。此外,AB-MCTS-M在MLE-Bench竞赛中表现出色,显示了其适应不同任务的能力。

这项研究灵感来源于自然界的进化与集体智能。Sakana AI此前开发了达尔文-哥德尔机(DGM),通过开放式搜索和自我修改生成解决方案。AB-MCTS正是基于这种“混合以使用”的理念,将现有强大AI模型的优势充分发挥。

论文与代码已开源,详情可见以下链接:
论文:https://arxiv.org/abs/2503.04412
算法(TreeQuest): https://github.com/SakanaAI/treequest
ARC-AGI实验:https://github.com/SakanaAI/ab-mcts-arc2

原文链接
本文链接:https://kx.umi6.com/article/21373.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI ChatGPT 将引入广告“供养”AGI,奥尔特曼承诺不干扰 AI 答案生成
2026-01-17 10:22:14
AI 聊天机器人 ChatGPT 今天突发故障,OpenAI 已紧急修复
2025-12-03 09:11:44
OpenAI:ChatGPT 目前每周为超过 8 亿用户提供服务
2025-12-08 22:51:33
ChatGPT 被指“PUA 人类”:反复强调“你最特别”,最终导致受害者自杀
2025-11-24 08:43:39
OpenAI 正式上线 ChatGPT 群聊:最高支持 20 人,AI 也能参与头脑风暴
2025-11-21 09:09:27
Similarweb 报告 13 日全球 AI 流量:Gemini 成 ChatGPT 最强劲对手,DeepSeek 正收复失地
2025-11-15 12:48:52
ChatGPT成人模式最快明年一季度上线!正测试年龄验证
2025-12-15 00:06:58
OpenAI 首席研究官爆料:奥尔特曼曾不止一次拉响“红色警报”
2025-12-19 16:59:39
黄仁勋:未来两三年90%的新知识由AI合成
2025-12-04 10:13:48
OpenAI 大胆预测:2030 年 ChatGPT 周活用户 26 亿,其中 2.2 亿人选择订阅
2025-11-26 10:36:37
OpenAI 偷师 Anthropic?ChatGPT 版“技能”曝光,让 AI 搞定复杂任务
2025-12-25 08:22:09
ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了
2025-11-16 13:35:18
ChatGPT 变身“修图师”,OpenAI 宣布接入 Adobe Photoshop、Acrobat
2025-12-10 22:10:04
24小时热文
更多
扫一扫体验小程序