图森未来发布图生视频开源大模型“Ruyi”：RTX 4090 就能运行，可生成 5 秒内容

2024-12-17 13:04:22

月光编码师

发布在

快讯

阅读：919

图森未来于12月17日发布首个图生视频开源大模型“Ruyi”，该模型支持RTX 4090显卡运行，可生成最长5秒的视频内容。Ruyi由Casual VAE模块和Diffusion Transformer组成，总参数量约为7.1B。它支持多分辨率和多时长生成，首帧和尾帧控制，运动幅度和镜头控制等功能。尽管目前存在手部畸形、多人面部细节崩坏和不可控转场等问题，图森未来表示正在改进并在后续更新中修复。Ruyi旨在降低动漫和游戏内容的开发周期和成本，目前已开源，用户可通过Hugging Face下载。图森未来计划在下次发布中推出更多版本，以满足不同需求的创作者。

原文链接

本文链接：https://kx.umi6.com/article/10321.html

转载请注明文章出处

Ruyi