1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

腾讯近日开源了混元语音数字人模型HunyuanVideo-Avatar,该模型由腾讯混元视频大模型及腾讯音乐天琴实验室技术联合研发。用户只需上传一张人物图像和一段音频,即可生成包含自然表情、唇形同步及全身动作的视频,支持头肩、半身与全身景别,以及多风格、多物种与双人场景。此模型适用于短视频创作、电商广告等多个领域,能有效降低制作成本。目前,单主体能力已开源,用户可通过腾讯混元官网体验,支持上传不超过14秒的音频生成视频,未来还将开放更多功能。开源地址及相关技术文档已同步发布。

原文链接
本文链接:https://kx.umi6.com/article/19389.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯开源混元语音数字人模型:一张图一段音频就能让图中人物说话唱歌
2025-05-28 18:12:03
腾讯开源最强3D生成模型,消费级显卡就能跑 | CVPR
2025-06-14 19:43:23
商汤日日新为 Claude API 用户提供“搬家”服务:可获 5000 万 Tokens 体验包
2025-09-06 15:35:37
上海:给予最高不超过1200万元支持AI+数字广告智能体研发
2025-09-08 11:59:20
OpenAI重组ChatGPT个性研究团队!
2025-09-06 11:36:18
两部门:推进人工智能技术在虚拟电厂(含负荷聚合商)、分布式储能、电动汽车车网互动等灵活性调节资源中的应用
2025-09-08 10:57:33
一键照片“手办化”:谷歌 Gemini 上线“Nano Banana”文生图模型,无需访问 AI Studio
2025-09-06 22:39:24
大模型破译甲骨文创下新 SOTA,复旦团队推出新框架
2025-09-08 14:00:34
通义千问系列最强大的语言模型:Qwen3-Max-Preview 上线
2025-09-06 00:26:52
上海:支持“AI+数字广告”产业创新服务平台建设 最高给予2000万元支持
2025-09-08 12:00:32
阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
2025-09-06 00:27:49
光刻机龙头首次布局AI软件 阿斯麦或领投“欧洲OpenAI” 还将参与公司管理
2025-09-08 11:57:36
深化与马斯克合作:消息称三星电子正与 xAI 就 ASIC 芯片代工谈判
2025-09-08 17:04:18
24小时热文
更多
扫一扫体验小程序