1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

AI版三个臭皮匠!ChatGPT/Gemini/DeepSeek合体拿下AGI测试最高分

ChatGPT的对话流畅性、Gemini的多模态能力、DeepSeek的长上下文分析……这些模型能否强强联合,共同解决问题?由Transformer作者之一Llion Jones创立的Sakana AI提出了一种新方法——AB-MCTS(自适应分支蒙特卡洛树搜索)。其核心思想是:最伟大的成就源于不同思想的协作,这一原则同样适用于AI。

AB-MCTS是一种让多个AI模型协同工作的算法。模型之间交换并完善建议,像人类团队一样合作。在ARC-AGI-2基准测试中,结合ChatGPT、Gemini和DeepSeek的AB-MCTS解决了30%的谜题,而顶尖独立模型仅解决23%。某些情况下,只有模型组合才能得出正确答案。

该算法结合了深度搜索(完善现有方案)和广度搜索(尝试全新方法),通过“无界分支”特性动态扩展搜索树。每个节点附带一个GEN子节点,用于生成新候选响应,同时利用贝叶斯后验预测分布和Thompson采样平衡探索与利用。Sakana AI还提出了两个变体:AB-MCTS-M(更分层,适合复杂任务)和AB-MCTS-A(更轻量,计算高效)。

实验表明,AB-MCTS在多种基准测试中表现优异。例如,在LiveCodeBench和CodeContest中,它在预算增加时显著优于基线方法;在挑战性极高的ARC-AGI测试中,AB-MCTS动态调整搜索范围,性能接近重复采样的强大基线。此外,AB-MCTS-M在MLE-Bench竞赛中表现出色,显示了其适应不同任务的能力。

这项研究灵感来源于自然界的进化与集体智能。Sakana AI此前开发了达尔文-哥德尔机(DGM),通过开放式搜索和自我修改生成解决方案。AB-MCTS正是基于这种“混合以使用”的理念,将现有强大AI模型的优势充分发挥。

论文与代码已开源,详情可见以下链接:
论文:https://arxiv.org/abs/2503.04412
算法(TreeQuest): https://github.com/SakanaAI/treequest
ARC-AGI实验:https://github.com/SakanaAI/ab-mcts-arc2

原文链接
本文链接:https://kx.umi6.com/article/21373.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI据悉拟在ChatGPT中接入视频生成工具Sora
2026-03-11 16:17:18
OpenAI的「广告模式」已初具雏形
2025-12-25 18:56:39
用时 31 个月:ChatGPT 移动端全球累计吸金突破 30 亿美元大关,跑赢 TikTok 与多款流媒体应用
2025-12-19 12:51:08
奥尔特曼称 ChatGPT 根除长破折号标点“顽疾”,用户可控 AI 输出风格
2025-11-15 15:57:34
力压 ChatGPT,韩国本土 AI 聊天机器人 Zeta 成该国最受欢迎 AI 应用
2025-11-11 19:23:07
OpenAI拟在ChatGPT中测试定向广告加码营收增长计划
2026-01-17 04:09:18
2025年消费级AI现状报告:产品亮点、遗憾与未来趋势
2025-12-30 15:28:46
AI 聊天机器人 ChatGPT 今天突发故障,OpenAI 已紧急修复
2025-12-03 09:11:44
AI要来卖东西了!代码曝光ChatGPT将加入广告内容
2025-12-01 15:14:18
OpenAI称将ChatGPT引入美国国防部通用人工智能平台
2026-02-10 15:22:03
OpenAI:《纽约时报》要求公司交出 ChatGPT 用户聊天记录,已要求法院驳回
2025-11-12 23:31:20
Sensor Tower:2025 谷歌 Gemini 强势上位,三项核心 AI 增长指标反超 ChatGPT
2025-12-06 15:35:30
最新测试版 App 代码显示,ChatGPT 未来或引入广告
2025-11-29 23:44:48
24小时热文
更多
扫一扫体验小程序