10月27日,美团LongCat团队发布并开源LongCat-Video视频生成模型。该模型在文生、图生视频任务上达到开源SOTA水平,支持分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性。基于Diffusion Transformer架构,模型通过“条件帧数量”区分任务,原生支持文生、图生及视频续写三大核心功能,形成完整任务闭环。其文生视频可生成720p、30fps高清内容,精准解析文本细节;图生视频严格保留图像属性与风格;视频续写是其核心能力,支持多帧续接长视频内容。依托创新机制,模型可稳定输出5分钟级长视频,无质量损失。项目已开源,详见GitHub与Hugging Face链接。
原文链接
本文链接:https://kx.umi6.com/article/27331.html
转载请注明文章出处
相关推荐
换一换
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
2025-09-22 12:58:11
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
大模型开源后如何投资AI? 顶级创投看好中国企业“换道超车”的机会
2025-08-01 13:02:40
Hugging Face开源小参数模型SmolLM3
2025-07-09 07:58:36
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
三家混战,大模型重回2023
2025-08-03 11:35:50
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
睿尔曼开源全球首个高质量、模态数量最多的真机数据集
2025-11-24 20:12:19
马斯克宣布Grok-2正式开源 Grok-3也将在大概6个月内开源
2025-08-24 18:18:35
660 文章
433757 浏览
24小时热文
更多
-
2025-12-27 00:08:38 -
2025-12-26 22:02:20 -
2025-12-26 21:02:03