1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

图森未来于12月17日发布首个图生视频开源大模型“Ruyi”,该模型支持RTX 4090显卡运行,可生成最长5秒的视频内容。Ruyi由Casual VAE模块和Diffusion Transformer组成,总参数量约为7.1B。它支持多分辨率和多时长生成,首帧和尾帧控制,运动幅度和镜头控制等功能。尽管目前存在手部畸形、多人面部细节崩坏和不可控转场等问题,图森未来表示正在改进并在后续更新中修复。Ruyi旨在降低动漫和游戏内容的开发周期和成本,目前已开源,用户可通过Hugging Face下载。图森未来计划在下次发布中推出更多版本,以满足不同需求的创作者。

原文链接
本文链接:https://kx.umi6.com/article/10321.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
智谱开源GLM-OCR模型
2026-02-03 09:27:36
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
全球首个医疗视频理解大模型开源!6k+组精标测试集与英雄榜同步上线,开发者速来!
2026-04-26 14:16:11
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
钉钉CLI开源!首批开放10项核心产品能力,原生支持ClaudeCode等
2026-03-27 20:17:17
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!
2025-12-14 22:01:20
企业级OpenClaw最强拍档来了!万亿参数的国产多模态大模型,刚刚开源发布
2026-03-05 19:45:14
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
阿里云创始人王坚:人工智能时代将带来“计算卫星”
2025-09-11 15:59:12
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
2025-11-11 18:20:16
24小时热文
更多
扫一扫体验小程序