1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月27日,美团LongCat团队发布并开源LongCat-Video视频生成模型。该模型在文生、图生视频任务上达到开源SOTA水平,支持分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性。基于Diffusion Transformer架构,模型通过“条件帧数量”区分任务,原生支持文生、图生及视频续写三大核心功能,形成完整任务闭环。其文生视频可生成720p、30fps高清内容,精准解析文本细节;图生视频严格保留图像属性与风格;视频续写是其核心能力,支持多帧续接长视频内容。依托创新机制,模型可稳定输出5分钟级长视频,无质量损失。项目已开源,详见GitHub与Hugging Face链接。

原文链接
本文链接:https://kx.umi6.com/article/27331.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
马斯克宣布Grok-2正式开源 Grok-3也将在大概6个月内开源
2025-08-24 18:18:35
阿里开源电影级视频生成模型通义万相2.2
2025-07-28 21:20:36
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
百度发布自研视频生成模型MuseSteamer
2025-07-02 13:40:48
刚刚,谷歌深夜上新Veo 3.1!网友狂刷2.75亿条,Sora 2要小心了
2025-10-17 22:25:46
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
大厂AI各走「开源」路
2025-10-17 09:09:57
视频生成模型大盘点:谁能定义下一代内容?
2025-08-07 20:57:55
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
三家混战,大模型重回2023
2025-08-03 11:35:50
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
Hugging Face 公布 4.5 亿参数开源机器人模型 SmolVLA,消费级硬件设备即可运行
2025-06-09 18:33:05
24小时热文
更多
扫一扫体验小程序