1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

腾讯混元于3月6日发布并开源图生视频模型,该模型能将图片转化为5秒短视频,并自动添加背景音效。用户上传图片并描述运动和镜头调度后,模型即可生成所需视频。此外,上传人物图片并输入文本或音频,可实现“对口型”效果,支持生成跳舞视频。该模型适用于多种角色和场景,参数量为130亿,支持开发者下载并基于LoRA训练衍生模型。开源内容包括权重、推理代码和训练代码。该模型具备超写实画质、流畅动作演绎等特性,已在Github和HuggingFace社区开放。

原文链接
本文链接:https://kx.umi6.com/article/14920.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
2025-08-24 10:10:55
超越DeepSeek,中国开源「集团军」正重塑全球AI生态
2025-04-28 13:51:06
开源版Genie3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
2025-08-19 10:59:13
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
DeepSeek会在全球AI竞争中沉沦吗?
2025-06-03 14:57:13
给Manus七分钟,它可以做什么
2025-05-19 22:24:28
腾讯混元开源视频音效生成模型
2025-08-28 16:29:54
腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解
2025-06-27 17:11:39
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
不玩噱头的北京,用数据和实力成就「全球开源之都」
2025-05-20 20:44:53
腾讯混元 0.5B、1.8B、4B、7B模型发布
2025-08-04 16:02:12
大模型开源后如何投资AI? 顶级创投看好中国企业“换道超车”的机会
2025-08-01 13:02:40
腾讯混元 0.5B、1.8B、4B、7B 模型开源发布,消费级显卡即可运行
2025-08-04 15:58:47
24小时热文
更多
扫一扫体验小程序