腾讯近日开源了混元语音数字人模型HunyuanVideo-Avatar,该模型由腾讯混元视频大模型及腾讯音乐天琴实验室技术联合研发。用户只需上传一张人物图像和一段音频,即可生成包含自然表情、唇形同步及全身动作的视频,支持头肩、半身与全身景别,以及多风格、多物种与双人场景。此模型适用于短视频创作、电商广告等多个领域,能有效降低制作成本。目前,单主体能力已开源,用户可通过腾讯混元官网体验,支持上传不超过14秒的音频生成视频,未来还将开放更多功能。开源地址及相关技术文档已同步发布。
原文链接
本文链接:https://kx.umi6.com/article/19389.html
转载请注明文章出处
相关推荐
换一换
腾讯开源混元语音数字人模型:一张图一段音频就能让图中人物说话唱歌
2025-05-28 18:12:03
腾讯开源最强3D生成模型,消费级显卡就能跑 | CVPR
2025-06-14 19:43:23
比亚迪用大模型,刷榜全球最低油耗
2025-10-24 21:53:50
前三季度广西工业人工智能核心产值同比增长超60%
2025-10-25 13:24:28
马斯克豪赌AI未来
2025-10-27 07:48:17
13款手机AI比拼 小米拿下金牌!
2025-10-27 18:12:32
巴林主权基金与SandboxAQ签署协议 借助人工智能加速药物研发
2025-10-27 17:10:01
OpenAI IPO计划第一步曝光,奥特曼骚操作看傻华尔街
2025-10-27 12:58:37
沙特Humain公司展现AI雄心:拟建设6GW数据中心 推出AI操作系统
2025-10-27 18:13:40
前英伟达工程师 Chip Huyen:若想在 AI 时代保持竞争力,必须立马动手实践
2025-10-27 17:08:57
AI 实时语音深度伪造技术实现突破性进展,诈骗成功率近 100%
2025-10-25 23:44:04
消息称微软 2025 财年财报掩盖投资 OpenAI 亏损,周三有可能公开情况
2025-10-27 22:17:35
豆包们,开始「上链接」
2025-10-27 10:54:08
527 文章
267363 浏览
24小时热文
更多
-
2025-10-27 22:20:44 -
2025-10-27 22:19:40 -
2025-10-27 22:17:35