1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月9日,腾讯混元推出并开源多模态定制化视频生成工具Hunyuan Custom。该工具基于混元视频生成大模型打造,支持文本、图像、音频、视频多模态输入生成视频。它能实现单主体、多主体视频生成,以及视频配音和局部编辑等功能,生成视频与输入主体高度一致。目前,单主体生成能力已开源并在官网上线,其他功能将在5月内陆续开源。用户上传图片并输入描述即可生成连贯自然的视频,还可通过音频驱动生成个性化表演,或在视频驱动模式下实现场景扩展。相比传统模型,Hunyuan Custom可灵活调整人物环境与动作,满足多样化创作需求。

原文链接
本文链接:https://kx.umi6.com/article/18359.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
北京人形机器人创新中心开源Pelican-VL 1.0模型
2025-11-13 21:24:03
智谱董事长刘德兵:完全支持开源,我们已开源 40 多款 AI 模型
2025-11-16 11:28:16
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
腾讯混元将发布原生多模态图像生成模型
2025-09-10 07:30:08
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
小米的首代机器人VLA大模型来了!丝滑赛德芙,推理延迟仅80ms丨全面开源
2026-02-12 21:45:01
腾讯混元AI Infra核心技术开源:推理吞吐提升30%
2026-02-04 19:00:46
智谱 GLM-4.7-Flash 模型发布并开源,可免费调用
2026-01-20 09:47:20
开源Agent模型榜第一名,现在是阿里通义DeepResearch
2025-09-18 15:54:31
Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
2025-11-04 12:11:12
阿里云创始人王坚:人工智能时代将带来“计算卫星”
2025-09-11 15:59:12
24小时热文
更多
扫一扫体验小程序