1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

腾讯近日开源了混元语音数字人模型HunyuanVideo-Avatar,该模型由腾讯混元视频大模型及腾讯音乐天琴实验室技术联合研发。用户只需上传一张人物图像和一段音频,即可生成包含自然表情、唇形同步及全身动作的视频,支持头肩、半身与全身景别,以及多风格、多物种与双人场景。此模型适用于短视频创作、电商广告等多个领域,能有效降低制作成本。目前,单主体能力已开源,用户可通过腾讯混元官网体验,支持上传不超过14秒的音频生成视频,未来还将开放更多功能。开源地址及相关技术文档已同步发布。

原文链接
本文链接:https://kx.umi6.com/article/19389.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯开源最强3D生成模型,消费级显卡就能跑 | CVPR
2025-06-14 19:43:23
打破科技数据壁垒!智会心研官宣:高级检索+AI深度分析,面向个人免费开放!
2026-05-09 12:10:17
中国信通院联合产业界发起智能体可信握手协议(ATH) 建立智能体开源社区
2026-05-07 20:39:11
一场“无电视”的发布会,揭开海信视像第二增长曲线
2026-05-09 16:22:15
AI算力的下一个瓶颈:涨价的CPU、抢不到的货
2026-05-09 01:51:35
英伟达CEO黄仁勋:若受邀 将随特朗普一同访问中国
2026-05-08 13:21:51
索尼和台积电将在日本成立图像传感器合资企业
2026-05-08 15:25:51
阶跃最新语音模型成为Artificial Analysis评测榜中国第一
2026-05-09 14:22:11
国家发展改革委主任郑栅洁赴上海人工智能实验室调研
2026-05-09 10:06:38
英伟达CEO黄仁勋:下一代AI基础设施将需要大量的光学连接 铜线已无法满足需求
2026-05-08 10:11:24
千问AI眼镜升级全球首款空间3D显示技术:主动感知用户需求
2026-05-08 16:28:14
DeepSeek据悉拟募资最高500亿元人民币
2026-05-08 21:41:39
美国科技巨头现金储备告急 AI战略投资下自由现金流降至十年最低
2026-05-08 17:32:02
24小时热文
更多
扫一扫体验小程序