1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

腾讯近日开源了混元语音数字人模型HunyuanVideo-Avatar,该模型由腾讯混元视频大模型及腾讯音乐天琴实验室技术联合研发。用户只需上传一张人物图像和一段音频,即可生成包含自然表情、唇形同步及全身动作的视频,支持头肩、半身与全身景别,以及多风格、多物种与双人场景。此模型适用于短视频创作、电商广告等多个领域,能有效降低制作成本。目前,单主体能力已开源,用户可通过腾讯混元官网体验,支持上传不超过14秒的音频生成视频,未来还将开放更多功能。开源地址及相关技术文档已同步发布。

原文链接
本文链接:https://kx.umi6.com/article/19389.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯开源最强3D生成模型,消费级显卡就能跑 | CVPR
2025-06-14 19:43:23
腾讯开源混元语音数字人模型:一张图一段音频就能让图中人物说话唱歌
2025-05-28 18:12:03
英伟达Jim Fan:「世界建模」是新一代预训练范式
2026-02-06 02:21:36
西门子收购法国半导体量测软件公司Canopus AI
2026-02-05 10:46:23
亚马逊CEO:AWS未完成订单高达2440亿美元 AI需求旺盛
2026-02-06 16:02:22
贾跃亭发布人形机器人
2026-02-05 08:40:09
阿里千问,加持首个奥运官方大模型
2026-02-05 11:45:42
黄仁勋台北「夜宴」
2026-02-05 02:21:17
30亿免单火爆,阿里千问APP登顶App Store榜首!
2026-02-06 17:00:48
俄罗斯首次启用人工智能技术进行宇航员选拔
2026-02-04 22:09:20
谷歌母公司ALPHABET:第四财季净利润344.55亿美元 同比增长29.8%
2026-02-05 07:35:44
Anthropic发布擅长金融研究的新人工智能模型 金融服务股应声下跌
2026-02-06 03:31:07
工信部:组织开展国家算力互联互通节点建设工作 提升整体算力水平
2026-02-06 16:00:23
24小时热文
更多
扫一扫体验小程序