1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

腾讯混元于3月6日发布并开源图生视频模型,该模型能将图片转化为5秒短视频,并自动添加背景音效。用户上传图片并描述运动和镜头调度后,模型即可生成所需视频。此外,上传人物图片并输入文本或音频,可实现“对口型”效果,支持生成跳舞视频。该模型适用于多种角色和场景,参数量为130亿,支持开发者下载并基于LoRA训练衍生模型。开源内容包括权重、推理代码和训练代码。该模型具备超写实画质、流畅动作演绎等特性,已在Github和HuggingFace社区开放。

原文链接
本文链接:https://kx.umi6.com/article/14920.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AMD甩出最猛两代AI芯片,算力飙涨、豪气堆料
2025-06-13 12:08:30
腾讯混元将发布原生多模态图像生成模型
2025-09-10 07:30:08
GitHub一周2000星!国产统一图像生成模型神器升级,理解质量双up,还学会了“反思”
2025-07-03 13:21:28
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
2025-08-04 17:00:39
马斯克背叛理想
2025-08-24 22:18:31
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
蚂蚁发布并开源万亿参数思考模型Ring-1T
2025-10-14 17:25:02
DeepSeek会在全球AI竞争中沉沦吗?
2025-06-03 14:57:13
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
通义千问最新AI编程大模型Qwen3-Coder正式开源
2025-07-23 07:45:34
24小时热文
更多
扫一扫体验小程序