1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年10月,清华大学与快手可灵团队联合发布了一种名为SVG的无VAE潜在扩散模型。该模型通过语义+细节双分支和分布对齐技术,在训练效率上提升62倍,生成速度提高35倍,解决了传统VAE因语义纠缠导致的生成效率低、多任务适配性差等问题。SVG基于DINOv3构建语义特征,并引入轻量级残差编码器补充高频细节,实验显示其在ImageNet数据集上的生成质量(FID值1.92)接近顶级模型水平,同时具备图像分类、语义分割等多任务通用能力。团队由清华博士后郑文钊领衔,相关论文已发布于arXiv,代码开源在GitHub。

原文链接
本文链接:https://kx.umi6.com/article/27412.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
寡姐带货国风 Polo 衫、马斯克穿牛仔走红毯:虚拟试衣新框架,只需两张图 30 秒即生成
2024-07-30 22:12:57
物理学家靠生物揭开AI创造力来源:起因竟是“技术缺陷”
2025-07-04 18:47:36
智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等
2024-10-29 16:33:28
华人团队终结Token危机:扩散模型数据潜力超自回归三倍
2025-08-13 17:38:29
VAE再被补刀!清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%
2025-10-28 15:54:58
12秒生成1万token!谷歌推出文本「扩散模型」Gemini Diffusion,研究员:演示都得降速看
2025-05-22 15:30:59
从不确定到安全:如何安全控制复杂物理系统
2025-07-19 17:56:25
谷歌 Fluid 颠覆共识:两大因素被发现,AI 文生图领域自回归模型超越扩散模型
2024-10-23 14:39:38
GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型
2025-01-11 17:39:16
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
2024-07-29 16:05:53
图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight
2025-08-01 14:00:21
扩散语言模型写代码!速度比自回归快10倍
2025-07-10 17:26:44
谢赛宁新作:VAE退役,RAE当立
2025-10-14 17:20:36
24小时热文
更多
扫一扫体验小程序