1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

何恺明团队提出分形生成模型,将计算效率提高4000倍,首次实现高分辨率逐像素图像生成。他们将生成模型抽象为“原子模块”,通过递归调用这些模块构建自相似分形架构。该模型受数学分形思想启发,使用参数化神经网络作为分形生成器,从数据中学习递归法则,适用于材料、蛋白质等领域。

在逐像素图像生成任务中,该模型表现优异。团队采用“分而治之”的策略,将自回归模型抽象成模块化单元。每个级别的生成器可从单个输入生成多个输出,使得分形框架在仅需线性数量的递归级别下实现输出的指数级增长。最终,自回归模型接收前一个生成器的输出,逐步细化生成过程。

在ImageNet 256×256数据集上,该模型生成一张图像需1.29秒,测试指标达到3.14bits/dim的负对数似然,超越现有自回归模型。此外,该模型在图像质量和计算效率上均表现出色,尤其在逐个像素生成高分辨率图像时,效率提升显著。

团队还结合掩码重建技术,实验表明该模型能准确预测被掩蔽的像素,有效捕捉高级语义。该成果由MIT何恺明团队和谷歌DeepMind全华人班底完成,一作黎天鸿本科毕业于清华姚班,现为MIT博士后。

原文链接
本文链接:https://kx.umi6.com/article/14365.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
提速63%!中科院生成式渲染器突破效率瓶颈,一致性提升20%,破解具身数据荒难题
2025-07-20 15:06:59
深圳:支持开展人工智能终端芯片核心技术攻关 提高端侧整体计算效率
2025-03-03 14:32:21
何恺明开辟分形生成模型新范式!计算效率提高4000倍,首次实现高分辨率逐像素生成
2025-02-26 13:32:44
生成式AI可能迎来下一个风口:TTT模型
2024-07-18 11:43:10
微软 CEO 纳德拉评 DeepSeek:令人印象深刻,计算效率非常高
2025-01-27 20:33:42
新一轮AI浏览器大战,谷歌将掉队了?
2025-09-05 10:20:22
Anthropic停服 智谱回应推出“Claude API 用户特别搬家计划”
2025-09-05 19:25:32
字节发了个机器人全能大模型,带队人李航
2025-09-06 12:34:33
9.16-9.17来腾讯全球数字生态大会,与行业大咖「智者见智」共话AI增益新机
2025-09-04 20:06:13
港科广×腾讯联手打造《我的世界》神操作,400张截图就能让AI挖矿通关,成本降至5%|EMNLP 2025
2025-09-04 19:05:34
OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首
2025-09-06 11:35:08
习近平向2025世界智能产业博览会致贺信
2025-09-05 10:23:48
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
24小时热文
更多
扫一扫体验小程序