正文:2025年10月,苹果研究团队发布论文《To Infinity and Beyond》,提出基于SSM架构的Mamba模型在Agent任务中表现优于Transformer。研究表明,Mamba通过内部状态更新机制,计算量随序列长度线性增长,支持流式处理且内存占用稳定,适合长任务和多交互场景。然而,Mamba对早期信息保留能力较弱,但通过引入外部工具(如指针、文件查看工具等),其性能显著提升。例如,在多位数加法和代码调试任务中,配备工具的Mamba准确率接近100%,远超Transformer。研究认为,‘Mamba+工具’组合将在Agent场景中展现更大潜力。
原文链接
本文链接:https://kx.umi6.com/article/27038.html
转载请注明文章出处
相关推荐
换一换
AI搜索一夜变天,专为Agent做搜索的赛道能否诞生百亿美金新巨头?
2025-07-23 12:48:11
Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式
2025-08-13 13:35:08
数字技术工人已到岗!时序大模型+Agent已掌握了工厂生产管控技术
2025-08-27 15:04:17
“日本版OpenAI”创下估值新高!Transformer八子之一创办,老黄也投了
2025-11-19 15:22:56
谷歌 AI 掌门人 Jeff Dean 对话 Transformer 作者:AI 提速 300%,1000 万倍工程师要来了
2025-02-22 18:43:08
Agent爆火背后的隐形推手
2025-06-13 19:13:54
「阶跃星辰」的一次豪赌
2025-05-21 08:55:53
速度秒杀GPT们10倍,国外的DeepSeek时刻来了?
2025-03-14 08:00:03
Transformer终结者!谷歌DeepMind全新MoR架构问世,新一代魔王来了
2025-07-19 11:51:22
Agent 要被吃进大模型了
2025-04-23 11:55:08
网易有道发布中国版“OpenClaw”,推出全场景个人助理Agent“LobsterAI”
2026-02-11 12:18:17
智谱发布Agent产品AutoGLM沉思 可以像人类一样边想边干
2025-03-31 10:24:22
当AI Agent遇到资本,为什么Genspark 能突出重围
2026-01-29 12:17:32
683 文章
481487 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22