豆包提出全新稀疏模型架构 UltraMem，推理成本较 MoE 最高可降 83% - AI优秘圈

1

免责声明：Al优秘圈所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（kx.umi6.com) 投诉及建议

7*24小时快讯

AI科普

合作

扫一扫体验小程序

小杨哥

个人资料

曝光推广

客户留言

投诉及建议

退出登录

×

7*24小时快讯 AI科普合作

2025-02-12 13:32:45

豆包提出全新稀疏模型架构 UltraMem，推理成本较 MoE 最高可降 83%

超频思维站

发布在

快讯

阅读：139

2月12日，字节跳动豆包大模型团队宣布提出全新稀疏模型架构UltraMem。该架构解决了MoE在推理时高额访存问题，速度提升2-6倍，成本最高可降低83%。UltraMem在同等计算资源下实现了业界领先的推理速度和模型性能，且在参数和激活条件下超越了MoE。该架构在Transformer架构下表现出优异的Scaling特性，为构建大规模模型开辟新路径。

原文链接

本文链接：https://kx.umi6.com/article/13205.html

转载请注明文章出处

MoE

UltraMem

推理成本

分享至

打开微信扫一扫

内容投诉

生成图片

超频思维站

670 文章

379189 浏览

阅读更多

24小时热文

更多

Meta使用阿里千问优化其最新AI模型

2025-12-11 00:19:01
Meta 全新 AI 模型“牛油果”开发内幕：消息称扎克伯格亲自抓，阿里 Qwen 模型参与蒸馏

2025-12-11 00:15:55
Meta全力转向闭源模型新模型Avocado或于明年春季推出

2025-12-10 23:15:05

扫一扫体验小程序