1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

正文:2025年7月19日,KAIST、谷歌DeepMind等机构联合发布了一种全新LLM架构——Mixture-of-Recursions(MoR),被业界称为潜在的“Transformer终结者”。MoR通过动态路由和递归机制,在推理速度上提升2倍,内存占用减半,并在135M到1.7B参数规模下划出新的帕累托前沿,全面超越传统Transformer。其核心创新包括小型路由器为token打分以减少冗余计算,以及KV缓存策略优化内存效率。实验表明,MoR在相同训练FLOPs下实现更低困惑度和更高小样本准确率,推理吞吐量提升超2倍。研究团队认为,MoR展现了高可扩展性和参数效率,或成为下一代LLM架构的标杆。

原文链接
本文链接:https://kx.umi6.com/article/22035.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌 AI 掌门人 Jeff Dean 对话 Transformer 作者:AI 提速 300%,1000 万倍工程师要来了
2025-02-22 18:43:08
谷歌把整个地球装进大模型!实时观测,按天更新
2025-08-01 08:58:42
谷歌DeepMind联合开发力提示技术 AI生成视频可模拟真实运动
2025-06-04 09:23:57
谷歌DeepMind推出用于机器人的AI模型
2025-03-13 14:27:30
揭秘注意力机制真正起源!10年前3项研究几乎同时独立提出,背后故事细节被Karpathy晒邮件公开了
2024-12-04 16:39:33
谷歌 DeepMind 开源 SynthID Text 工具,可辨别 AI 生成的文字
2024-10-27 16:10:18
谷歌 DeepMind 专利革新蛋白质设计,开启 AI 原子级精度新时代
2024-12-07 14:46:21
两位00后,融资8个亿
2024-06-29 16:53:08
GPT-5与Transformer共同发明人Lukasz Kaiser重磅加盟,2025 全球机器学习技术大会全日程官宣!
2025-09-18 16:55:56
谷歌DeepMind在数学奥林匹克中达到金牌级别成绩
2025-07-22 14:36:07
谷歌DeepMind开发新AI 可为视频生成配乐和对白
2024-06-20 11:22:33
另一位Yao Shunyu也跳槽了:与Anthropic价值观有根本分歧
2025-10-09 09:04:51
谷歌 DeepMind 研究再登 Nature 封面,隐形水印让 AI 无所遁形
2024-11-08 13:22:18
24小时热文
更多
扫一扫体验小程序