2026年5月,何恺明团队发布首个语言模型ELF,参数仅105M,采用扩散语言模型(DLM)新路线。与传统自回归方法不同,ELF全程在连续embedding空间生成,最后一步才离散化为token,显著减少训练和采样成本。实验显示,ELF在OpenWebText任务中以32步采样、45B训练token将生成困惑度降至24,超越主流扩散模型,后者通常需1024步和500B+训练token。ELF还通过‘连续表示’与‘离散输出’分离设计,在质量、速度和成本上实现突破。团队成员包括MIT博士生胡珂雅、Linlu Qiu及清华姚班本科生陆伊炀等,研究结合视觉与语言交叉领域,成果已引发广泛关注。
原文链接
本文链接:https://kx.umi6.com/article/35756.html
转载请注明文章出处
相关推荐
换一换
今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断
2026-06-06 15:50:06
何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与
2024-06-23 12:39:40
何恺明MIT两名新弟子曝光:首次有女生入组,另一位是FNO发明者,均为华人
2025-11-06 20:12:52
MIT终身教授何恺明,入职谷歌了
2025-06-26 10:56:19
全员本科生!何恺明组新作:文生图,258M参数就够了
2026-06-18 17:37:13
何恺明团队新作:扩散模型可能被用错了
2025-11-20 11:15:51
后生可畏!何恺明团队新成果发布,共一清华姚班大二在读
2025-12-04 09:08:44
何恺明MIT开门弟子名单:奥赛双料金牌得主、清华姚班学霸在列
2024-12-03 16:20:13
LSTM之父向何恺明开炮:我学生才是残差学习奠基人
2025-10-19 22:54:26
邓明扬一作论文改写生成范式!何恺明也署名了
2026-02-06 02:22:57
何恺明带大二本科生颠覆扩散图像生成:扔掉多步采样和潜空间,一步像素直出
2026-02-02 16:48:05
何恺明组三位本科生领衔!持续聚焦Flow模型,突破归一化流生成效率瓶颈
2025-12-15 15:44:36
WAIC UP!|AI圈都在聊参数,我们偏不
2026-06-25 18:33:04
732 文章
754125 浏览
24小时热文
更多
-
2026-06-27 13:56:52 -
2026-06-27 10:51:01 -
2026-06-27 00:30:24