1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

腾讯混元于3月6日发布并开源图生视频模型,该模型能将图片转化为5秒短视频,并自动添加背景音效。用户上传图片并描述运动和镜头调度后,模型即可生成所需视频。此外,上传人物图片并输入文本或音频,可实现“对口型”效果,支持生成跳舞视频。该模型适用于多种角色和场景,参数量为130亿,支持开发者下载并基于LoRA训练衍生模型。开源内容包括权重、推理代码和训练代码。该模型具备超写实画质、流畅动作演绎等特性,已在Github和HuggingFace社区开放。

原文链接
本文链接:https://kx.umi6.com/article/14920.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
北京人形机器人创新中心开源Pelican-VL 1.0模型
2025-11-13 21:24:03
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
2025-09-22 12:58:11
马斯克背叛理想
2025-08-24 22:18:31
字节跳动开源其 AI IDE 工具核心组件 Trae-Agent
2025-07-07 08:24:33
创想三维接入腾讯混元,3D 打印进入 AI 建模时代
2025-08-11 21:08:06
Hugging Face开源小参数模型SmolLM3
2025-07-09 07:58:36
百度正式开源文心大模型 4.5 系列模型
2025-06-30 11:41:55
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
腾讯混元 OCR 模型宣布开源:参数仅 1B,多项核心能力 SOTA
2025-11-25 14:56:08
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
24小时热文
更多
扫一扫体验小程序