1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

何恺明团队提出分形生成模型,将计算效率提高4000倍,首次实现高分辨率逐像素图像生成。他们将生成模型抽象为“原子模块”,通过递归调用这些模块构建自相似分形架构。该模型受数学分形思想启发,使用参数化神经网络作为分形生成器,从数据中学习递归法则,适用于材料、蛋白质等领域。

在逐像素图像生成任务中,该模型表现优异。团队采用“分而治之”的策略,将自回归模型抽象成模块化单元。每个级别的生成器可从单个输入生成多个输出,使得分形框架在仅需线性数量的递归级别下实现输出的指数级增长。最终,自回归模型接收前一个生成器的输出,逐步细化生成过程。

在ImageNet 256×256数据集上,该模型生成一张图像需1.29秒,测试指标达到3.14bits/dim的负对数似然,超越现有自回归模型。此外,该模型在图像质量和计算效率上均表现出色,尤其在逐个像素生成高分辨率图像时,效率提升显著。

团队还结合掩码重建技术,实验表明该模型能准确预测被掩蔽的像素,有效捕捉高级语义。该成果由MIT何恺明团队和谷歌DeepMind全华人班底完成,一作黎天鸿本科毕业于清华姚班,现为MIT博士后。

原文链接
本文链接:https://kx.umi6.com/article/14365.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软 CEO 纳德拉评 DeepSeek:令人印象深刻,计算效率非常高
2025-01-27 20:33:42
提速63%!中科院生成式渲染器突破效率瓶颈,一致性提升20%,破解具身数据荒难题
2025-07-20 15:06:59
深圳:支持开展人工智能终端芯片核心技术攻关 提高端侧整体计算效率
2025-03-03 14:32:21
生成式AI可能迎来下一个风口:TTT模型
2024-07-18 11:43:10
何恺明开辟分形生成模型新范式!计算效率提高4000倍,首次实现高分辨率逐像素生成
2025-02-26 13:32:44
Ubuntu 团队测试 AI 生成代码:总体表现尚可,但一小部分函数“完全错误”
2025-12-07 20:45:46
联想入股原力聚合机器人科技公司
2025-12-08 11:27:54
OpenAI:ChatGPT 目前每周为超过 8 亿用户提供服务
2025-12-08 22:51:33
抖音副总裁李亮:AI 手机助手本质是“机主”授权,与入侵、黑客、隐私无关
2025-12-08 21:48:42
智谱 GLM-4.6V 系列多模态 AI 大模型发布并开源,API 降价 50%
2025-12-08 20:45:30
OpenAI:科技、医疗和制造业是人工智能增长最快的行业
2025-12-08 20:47:34
厦门“十五五”规划建议:强化算力、算法、数据等高效供给 发展壮大数字经济核心产业
2025-12-08 14:32:20
加快发展新质生产力 上海自动驾驶测试道路总里程超5200公里
2025-12-07 13:29:51
24小时热文
更多
扫一扫体验小程序