1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源

仅需8张GPU,就能实现近SOTA的高质量图像生成效果。模型名为LightGen,由港科大Harry Yang团队联合Everlyn AI等机构打造,借助知识蒸馏(KD)和直接偏好优化(DPO)策略,大幅降低训练成本。

LightGen参数量更小、数据规模更精简,却在多项基准评测中超越部分SOTA模型。其训练时间从数千GPU days缩短至88个GPU days,显著提升效率。LightGen采用两阶段训练:先用SOTA模型生成高质量合成数据,再通过DPO优化细节与空间关系。

实验显示,LightGen在256×256和512×512分辨率下的表现接近或超过现有SOTA模型。加入DPO后,模型在位置准确性和高频细节方面表现更佳。数据规模达200万张时,性能趋于饱和。未来可探索其在视频生成等领域的应用。

论文链接:https://arxiv.org/abs/2503.08619
模型链接:https://huggingface.co/Beckham808/LightGen
项目链接:https://github.com/XianfengWu01/LightGen

原文链接
本文链接:https://kx.umi6.com/article/15712.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Ilya宣判:预训练即将终结!NeurIPS现场沸腾
2024-12-14 12:44:30
OpenAI 推迟免费版 ChatGPT 图像生成功能上线时间
2025-03-27 07:32:32
全新预训练数据筛选方案,让数据效率提升10倍!配置仅需fastText评分器|港科大vivo出品
2025-05-16 13:48:48
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
2025-04-25 15:13:42
ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展
2025-03-26 04:32:17
马斯克宣布Grok 3即将推出:已完成预训练 计算量超Grok 2十倍
2025-01-05 15:54:18
OpenAI 扩展 Responses API:支持 MCP、图像生成等
2025-05-22 11:28:26
一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
2025-04-18 20:22:57
ChatGPT闯入一条危险赛道:新图像生成功能极擅长伪造收据
2025-04-02 15:32:04
小米大模型团队提出对角蛇形自回归图像生成方式
2025-04-18 17:22:44
GPT-4o的P图太火了,GPU在融化,官方终于限流了
2025-03-28 21:07:22
GPT-4o骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了
2025-03-31 12:26:06
OpenAI发布生图神器狙击Google,一句话精细P图
2025-03-26 08:41:03
24小时热文
更多
扫一扫体验小程序