2025-05-09 12:47:33
腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力
阅读:496
5月9日,腾讯混元推出并开源多模态定制化视频生成工具Hunyuan Custom。该工具基于混元视频生成大模型打造,支持文本、图像、音频、视频多模态输入生成视频。它能实现单主体、多主体视频生成,以及视频配音和局部编辑等功能,生成视频与输入主体高度一致。目前,单主体生成能力已开源并在官网上线,其他功能将在5月内陆续开源。用户上传图片并输入描述即可生成连贯自然的视频,还可通过音频驱动生成个性化表演,或在视频驱动模式下实现场景扩展。相比传统模型,Hunyuan Custom可灵活调整人物环境与动作,满足多样化创作需求。
原文链接
本文链接:https://kx.umi6.com/article/18359.html
转载请注明文章出处
相关推荐
换一换
英伟达开源Newton引擎与GR00T N1.6模型
2025-09-30 08:28:35
小米首席语音科学家 Daniel Povey:AI 发展的本质就像生物进化,不开源要慢 1000 倍
2025-12-15 16:49:04
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
2025-08-04 17:00:39
腾讯混元 Voyager3D 世界模型发布,可生成长距离、世界一致的漫游场景
2025-09-02 17:35:42
上传一张图、主演任何视频,“性能最强动作生成模型”阿里通义万相 Wan2.2-Animate 开源
2025-09-19 15:14:57
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
群核科技发布空间大模型,或解决视频生成时空一致性难题
2025-08-26 14:47:34
2025外滩大会:蚂蚁、人大发布首个原生MoE扩散语言模型,将于近期开源
2025-09-12 10:08:55
大厂AI各走「开源」路
2025-10-17 09:09:57
华为UCM推理记忆管理技术正式开源
2025-11-05 16:17:45
AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型
2025-10-11 10:06:15
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
给大模型生图“去油”,腾讯混元新研究 SRPO 公布
2025-09-17 21:36:40
629 文章
428257 浏览
24小时热文
更多
-
2026-01-31 15:44:24 -
2026-01-31 15:43:18 -
2026-01-31 12:37:50