图森未来于12月17日发布首个图生视频开源大模型“Ruyi”,该模型支持RTX 4090显卡运行,可生成最长5秒的视频内容。Ruyi由Casual VAE模块和Diffusion Transformer组成,总参数量约为7.1B。它支持多分辨率和多时长生成,首帧和尾帧控制,运动幅度和镜头控制等功能。尽管目前存在手部畸形、多人面部细节崩坏和不可控转场等问题,图森未来表示正在改进并在后续更新中修复。Ruyi旨在降低动漫和游戏内容的开发周期和成本,目前已开源,用户可通过Hugging Face下载。图森未来计划在下次发布中推出更多版本,以满足不同需求的创作者。
原文链接
本文链接:https://kx.umi6.com/article/10321.html
转载请注明文章出处
相关推荐
换一换
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文
2025-07-23 09:45:56
低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!
2025-12-14 22:01:20
小米开源首个原生端到端语音大模型
2025-09-19 10:10:03
商汤开源空间智能大模型SenseNova-SI
2025-11-11 08:59:30
谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持
2025-06-26 10:56:45
Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
2025-11-04 12:11:12
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
Coze/Dify/FastGPT/N8N :该如何选择Agent平台?
2025-06-09 10:25:58
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
584 文章
349492 浏览
24小时热文
更多
-
2025-12-19 23:18:47 -
2025-12-19 23:17:39 -
2025-12-19 23:16:29