1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

一张图0.1秒生成上半身3D化身!清华IDEA新框架入选ICCV 2025

清华大学与粤港澳大湾区数字经济研究院(IDEA)的研究团队提出了一种全新框架GUAVA,仅需单张图像和0.1秒即可生成逼真的上半身3D化身,并支持实时动画和渲染。该研究已被ICCV 2025接收。

创建包含细致面部表情和丰富手势的上半身3D模型,在电影、游戏和虚拟会议等领域具有重要价值,但传统方法通常依赖多视角视频或针对个体单独训练,效率低下且难以满足实时需求。GUAVA突破了这些限制,首次实现了从单张图像生成高质量、可驱动的上半身3D高斯化身。相比基于扩散模型的2D方法,GUAVA利用3D高斯技术确保更好的身份一致性(ID Consistency),并引入富有表现力的人体模型EHM(Expressive Human Model)以捕捉细腻的面部表情和手势细节。此外,GUAVA结合逆纹理映射技术和神经渲染器,进一步提升了渲染质量和效率。

GUAVA的核心创新包括:
1. EHM模型与精确跟踪:融合SMPLX和FLAME模型,改进面部表情捕捉能力,并通过两阶段追踪方法实现精准的姿态和表情估计;
2. 快速重建与双分支设计:通过“模板高斯”和“UV高斯”两个分支分别预测几何结构和纹理细节,完成高效重建;
3. 实时动画与渲染:支持根据新姿势参数生成动画,并通过神经细化器优化渲染效果。

实验表明,GUAVA在自重演(self-reenactment)和跨重演(cross-reenactment)场景中均优于现有2D和3D方法。与2D方法相比,GUAVA在PSNR、SSIM等图像质量指标上表现最佳,动画速度达50 FPS;与3D方法相比,其重建时间仅为0.1秒,远快于其他方法的数分钟至数小时。此外,GUAVA在极端姿势和未见区域的表现尤为出色,展现出更强的鲁棒性和泛化能力。

目前,GUAVA的代码已开源,感兴趣者可通过以下链接了解更多信息:
论文地址: https://arxiv.org/pdf/2505.03351
项目主页:https://eastbeanzhang.github.io/GUAVA/
开源代码:https://github.com/Pixel-Talk/GUAVA
视频Demo: https://www.bilibili.com/video/BV1k45AzaEpW/

原文链接
本文链接:https://kx.umi6.com/article/23949.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
一张图0.1秒生成上半身3D化身!清华IDEA新框架入选ICCV 2025
2025-08-21 16:34:56
中国游戏出海的6大趋势
2025-08-22 12:44:34
均普智能上半年净亏损收窄 普智机器人正在生产推进
2025-08-23 08:58:15
中信建投:卫星互联网建设有望加速 关注商业航天投资机会
2025-08-22 08:45:06
叫板OpenAI,DeepSeek-V3.1正式发布
2025-08-21 18:37:17
谷歌以47美分价格向美政府提供AI服务
2025-08-22 10:52:42
韩国将大力发展人工智能纳入未来五年经济战略
2025-08-22 23:54:20
Kimi K2 高速版 AI 模型提速,输出速度最高可达每秒 100 Tokens
2025-08-22 16:51:22
只有5%AI项目在挣钱!MIT最新报告印证奥特曼警告
2025-08-22 17:49:47
涉嫌使用盗版成人影片训练AI大模型:Meta遭起诉索赔3.59亿美元
2025-08-22 15:51:07
安徽:降低算力使用成本 促进垂类模型应用
2025-08-21 16:41:03
国家数据局:国内多数AI模型训练使用的中文数据占比已超60%
2025-08-21 15:37:53
北京互联网法院:利用 AI 软件恶搞、丑化他人肖像,构成人格权侵权
2025-08-22 17:50:44
24小时热文
更多
扫一扫体验小程序