综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
学术插图新神器!万字材料秒出SVG,西湖大学出品 | ICLR’26
你是否曾为论文截稿时的插图发愁?画框画到手抽筋,Nano banana生成的图颜值高但逻辑错乱,甚至带着“克苏鲁”风格的模糊字符;好不容易调好Prompt,却只能得到一张无法编辑的“死图”。现在,这些问题将被终结。
西湖大学团队推...
原文链接
2025年10月,清华大学与快手可灵团队联合发布了一种名为SVG的无VAE潜在扩散模型。该模型通过语义+细节双分支和分布对齐技术,在训练效率上提升62倍,生成速度提高35倍,解决了传统VAE因语义纠缠导致的生成效率低、多任务适配性差等问题。SVG基于DINOv3构建语义特征,并引入轻量级残差编码器补充高频细节,实验显示其在ImageNet数据集上的生成质量(FID值1.92)接近顶级模型水平,同时具备图像分类、语义分割等多任务通用能力。团队由清华博士后郑文钊领衔,相关论文已发布于arXiv,代码开源在GitHub。
原文链接
加载更多
暂无内容