近日,MIT副教授何恺明携5位本科生团队发布文生图新模型MiniT2I。在业界依赖数十亿参数的背景下,该团队基于全新MM-JiT架构“删繁就简”,摒弃VAE等复杂模块,直接在像素空间进行扩散生成。最终,MiniT2I仅用258M参数即实现优异效果,训练成本仅需8张H100显卡运行约3天,相当于一次标准ImageNet实验算力。此外,除何恺明外,论文其余5位作者均为MIT或清华本科生,且多为国际奥赛金牌得主。该研究不仅打破了文生图对海量算力的依赖,更展现了年轻学者在AI前沿的巨大潜力。
原文链接
本文链接:https://kx.umi6.com/article/36600.html
转载请注明文章出处
相关推荐
换一换
一个万能文生图提示框架,人人都能成为专业AI设计师
2025-04-07 16:05:42
腾讯混元 DiT 文生图大模型开源 6G 小显存版本,一同开源打标模型
2024-07-05 10:42:38
何恺明组三位本科生领衔!持续聚焦Flow模型,突破归一化流生成效率瓶颈
2025-12-15 15:44:36
Runway全面开放新文生图模型Frames
2025-01-22 08:53:58
何恺明MIT两名新弟子曝光:首次有女生入组,另一位是FNO发明者,均为华人
2025-11-06 20:12:52
今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断
2026-06-06 15:50:06
AI文生图最大问题不存在了,最新Gemini2.0指哪改哪
2025-03-14 15:16:12
清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026
2026-04-22 15:20:13
神秘 AI 模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney
2024-10-29 14:31:02
字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒
2025-04-19 15:47:04
豆包支持带有指定文字的图片生成,App已开启测试
2024-12-06 13:22:39
豆包文生图技术报告发布
2025-03-12 13:30:10
LSTM之父向何恺明开炮:我学生才是残差学习奠基人
2025-10-19 22:54:26
767 文章
750702 浏览
24小时热文
更多
-
2026-06-18 18:43:07 -
2026-06-18 18:41:26 -
2026-06-18 18:39:50