2026年5月,何恺明团队发布首个语言模型ELF,参数仅105M,采用扩散语言模型(DLM)新路线。与传统自回归方法不同,ELF全程在连续embedding空间生成,最后一步才离散化为token,显著减少训练和采样成本。实验显示,ELF在OpenWebText任务中以32步采样、45B训练token将生成困惑度降至24,超越主流扩散模型,后者通常需1024步和500B+训练token。ELF还通过‘连续表示’与‘离散输出’分离设计,在质量、速度和成本上实现突破。团队成员包括MIT博士生胡珂雅、Linlu Qiu及清华姚班本科生陆伊炀等,研究结合视觉与语言交叉领域,成果已引发广泛关注。
原文链接
本文链接:https://kx.umi6.com/article/35756.html
转载请注明文章出处
相关推荐
换一换
何恺明团队新作:扩散模型可能被用错了
2025-11-20 11:15:51
何恺明MIT开门弟子名单:奥赛双料金牌得主、清华姚班学霸在列
2024-12-03 16:20:13
后生可畏!何恺明团队新成果发布,共一清华姚班大二在读
2025-12-04 09:08:44
何恺明MIT两名新弟子曝光:首次有女生入组,另一位是FNO发明者,均为华人
2025-11-06 20:12:52
何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与
2024-06-23 12:39:40
邓明扬一作论文改写生成范式!何恺明也署名了
2026-02-06 02:22:57
何恺明组三位本科生领衔!持续聚焦Flow模型,突破归一化流生成效率瓶颈
2025-12-15 15:44:36
何恺明带大二本科生颠覆扩散图像生成:扔掉多步采样和潜空间,一步像素直出
2026-02-02 16:48:05
LSTM之父向何恺明开炮:我学生才是残差学习奠基人
2025-10-19 22:54:26
MIT终身教授何恺明,入职谷歌了
2025-06-26 10:56:19
广州:开展人工智能百模培育行动
2026-05-11 16:22:32
赢RTX 50显卡套装!七彩虹iGame AI产品视频创作大赛开启
2026-05-12 18:24:53
韩国政策高层提议:以AI产业的超额利润向全体国民发放“公民红利”
2026-05-12 11:07:12
717 文章
620166 浏览
24小时热文
更多
-
2026-05-13 11:32:54 -
2026-05-13 11:29:48 -
2026-05-13 10:30:27