天桥脑科学研究院团队自研的OMNE AI大模型框架登上基准测试GAIA榜首

2024-10-24 13:09:52

发布在

科普

阅读：1081

天桥脑科学研究院的AI团队近期在AI技术领域取得了重要进展，其自主研发的OMNE Multiagent大模型框架在GAIA基准测试中名列前茅。

OMNE Multiagent大模型基于长期记忆（Long Term Memory, LTM）的多智能体协作框架，每个智能体拥有相同的系统结构，能够自主学习和理解环境。基于LTM的多智能体协同体系使得AI系统能实时适应个体行为变化，优化任务规划与执行，推动个性化和高效的自我进化。

根据Hugging Face发布的GAIA基准测试排行榜，OMNE的整体成功率为40.53%，领先于Meta、微软、Hugging Face、普林斯顿大学、香港大学、英国AI安全研究所、百川等知名机构，而GPT-4仅为15%。因此，OMNE Multiagent大模型框架登上了GAIA基准测试排行榜榜首，超越了许多顶尖机构提交的多智能体框架。

GAIA基准测试系统由Meta AI、Hugging Face和AutoGPT联合推出，用于评估AI助手的能力，包括推理、大模型多智能体处理、网页浏览和工具使用等功能。OMNE框架的成功，展示了其技术深度与创新能力。

本次突破在于借鉴了天桥脑科学研究院多年的大脑研究积累，通过给予Agent长期记忆的能力，让模型进行深度慢思考，加强了LLM对复杂问题的决策能力。通过引入更高效的逻辑推理，OMNE不仅提升了单个智能体的智能水平，还通过优化协作机制，显著增强了多智能体系统的整体能力。

天桥脑科学研究院AI团队负责人表示：“我们非常自豪地看到OMNE框架登上GAIA榜首。这表明了利用LTM进行AI自我进化及解决现实世界问题的巨大潜力。”

天桥脑科学研究院由陈天桥、雒芊芊夫妇出资10亿美元创建，是世界上最大的私人脑科学研究机构之一。研究院支持AI和脑科学研究，致力于造福人类，并已与《Science》杂志合作推出全球AI驱动科学大奖，举办了多项高水平国际会议和夏校项目，培养跨学科的青年AI人才。

原文链接

本文链接：https://kx.umi6.com/article/7805.html

转载请注明文章出处

GAIA基准测试