苹果AI选Mamba：Agent任务比Transformer更好

2025-10-21 14:27:27

GhostPilot

发布在

快讯

阅读：642

正文：2025年10月，苹果研究团队发布论文《To Infinity and Beyond》，提出基于SSM架构的Mamba模型在Agent任务中表现优于Transformer。研究表明，Mamba通过内部状态更新机制，计算量随序列长度线性增长，支持流式处理且内存占用稳定，适合长任务和多交互场景。然而，Mamba对早期信息保留能力较弱，但通过引入外部工具（如指针、文件查看工具等），其性能显著提升。例如，在多位数加法和代码调试任务中，配备工具的Mamba准确率接近100%，远超Transformer。研究认为，‘Mamba+工具’组合将在Agent场景中展现更大潜力。

原文链接

本文链接：https://kx.umi6.com/article/27038.html

转载请注明文章出处

Agent