天桥脑科学研究院的AI团队近期在AI技术领域取得了重要进展,其自主研发的OMNE Multiagent大模型框架在GAIA基准测试中名列前茅。
OMNE Multiagent大模型基于长期记忆(Long Term Memory, LTM)的多智能体协作框架,每个智能体拥有相同的系统结构,能够自主学习和理解环境。基于LTM的多智能体协同体系使得AI系统能实时适应个体行为变化,优化任务规划与执行,推动个性化和高效的自我进化。
根据Hugging Face发布的GAIA基准测试排行榜,OMNE的整体成功率为40.53%,领先于Meta、微软、Hugging Face、普林斯顿大学、香港大学、英国AI安全研究所、百川等知名机构,而GPT-4仅为15%。因此,OMNE Multiagent大模型框架登上了GAIA基准测试排行榜榜首,超越了许多顶尖机构提交的多智能体框架。
GAIA基准测试系统由Meta AI、Hugging Face和AutoGPT联合推出,用于评估AI助手的能力,包括推理、大模型多智能体处理、网页浏览和工具使用等功能。OMNE框架的成功,展示了其技术深度与创新能力。
本次突破在于借鉴了天桥脑科学研究院多年的大脑研究积累,通过给予Agent长期记忆的能力,让模型进行深度慢思考,加强了LLM对复杂问题的决策能力。通过引入更高效的逻辑推理,OMNE不仅提升了单个智能体的智能水平,还通过优化协作机制,显著增强了多智能体系统的整体能力。
天桥脑科学研究院AI团队负责人表示:“我们非常自豪地看到OMNE框架登上GAIA榜首。这表明了利用LTM进行AI自我进化及解决现实世界问题的巨大潜力。”
天桥脑科学研究院由陈天桥、雒芊芊夫妇出资10亿美元创建,是世界上最大的私人脑科学研究机构之一。研究院支持AI和脑科学研究,致力于造福人类,并已与《Science》杂志合作推出全球AI驱动科学大奖,举办了多项高水平国际会议和夏校项目,培养跨学科的青年AI人才。
.png)

-
2025-07-20 19:08:20
-
2025-07-20 19:07:11
-
2025-07-20 17:06:49