腾讯近日开源了混元语音数字人模型HunyuanVideo-Avatar,该模型由腾讯混元视频大模型及腾讯音乐天琴实验室技术联合研发。用户只需上传一张人物图像和一段音频,即可生成包含自然表情、唇形同步及全身动作的视频,支持头肩、半身与全身景别,以及多风格、多物种与双人场景。此模型适用于短视频创作、电商广告等多个领域,能有效降低制作成本。目前,单主体能力已开源,用户可通过腾讯混元官网体验,支持上传不超过14秒的音频生成视频,未来还将开放更多功能。开源地址及相关技术文档已同步发布。
原文链接
本文链接:https://kx.umi6.com/article/19389.html
转载请注明文章出处
相关推荐
换一换
腾讯开源最强3D生成模型,消费级显卡就能跑 | CVPR
2025-06-14 19:43:23
AI伪人脸泛滥!看的直恶心、人类文明凶多吉少了
2026-06-18 19:45:08
魔法原子牵手万机易租,全栈产品入驻2.0平台共建租赁生态
2026-06-18 21:46:18
软银孙正义回应AI泡沫论:这对AI是侮辱 我将战斗至70岁
2026-06-24 16:40:50
微软CEO呼吁打破AI巨头垄断:推广廉价模型 给用户更多选择
2026-06-22 16:55:13
阿里QoderWork推“峰谷Token”,夜间使用Qwen3.7低至2折
2026-06-24 13:31:57
智能座舱之王「转身」物理AI,高通需要被重估了
2026-06-24 09:20:00
云计算一哥,让小鹏、Kimi和猎豹都爽了一把
2026-06-23 21:55:04
ABot-Earth0.5登顶Hugging Face论文三榜第一,获国际图形学权威陈宝权好评
2026-06-18 18:38:12
Fable 5 刚被封杀,OpenRouter 用「多模型协作」搞出了「平替天团」
2026-06-22 18:56:53
Meta前高管寄语毕业生: AI纪元十年规划已过时 只需做好两件事
2026-06-22 12:43:31
57场面试杀进OpenAI!华人博士开源「AI面经」,含泪推荐
2026-06-23 16:41:21
全球首个人形机器人通用小脑来了!全球最大规模2万小时人类动作数据,实现零样本泛化
2026-06-19 12:14:06
719 文章
700883 浏览
24小时热文
更多
-
2026-06-25 18:37:27 -
2026-06-25 18:33:04 -
2026-06-25 18:31:26