1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

美团最新开源的视频生成模型LongCat-Video,以13.6B参数量成为当前开源领域的SOTA(最佳性能)模型。这款模型支持文生视频、图生视频以及视频延长功能,能够生成长达数分钟的高质量视频,画质清晰且物理逻辑逼真。

官方演示中,无论是空中滑板、特效变身,还是第一视角骑行视频,LongCat-Video均展现了出色的真实感与一致性。其文生视频能力在开源模型中表现顶尖,甚至在部分维度可媲美谷歌闭源模型Veo3。而其长视频生成能力(稳定输出5分钟)更是被视为迈向AI视频终极形态的重要一步。

具体来看,LongCat-Video具备以下亮点:
1. 文生视频:支持720p、30fps高清生成,语义理解与视觉呈现达到开源SOTA水平,尤其擅长复杂场景如“水上芭蕾”。
2. 图生视频:能保留参考图像的主体属性和风格,适用于商业宣传或创意制作,例如机器人日常vlog。
3. 视频延长:通过提示词续写生成连续剧式长视频,解决了传统模型中常见的色彩漂移和质量下降问题。

技术上,LongCat-Video基于Diffusion Transformer(DiT)框架设计,统一处理多种任务,并采用块稀疏注意力、从粗到精生成范式等创新方法,提升效率与质量。此外,交互式生成支持让用户为不同片段设置独立指令,进一步增强了创作灵活性。

值得注意的是,美团近期在AI领域动作频频,从基础大模型LongCat-Flash系列到语音模型LongCat-Audio-Codec,再到现实场景Agent评测基准VitaBench,展现出跨界布局的决心。

LongCat-Video已开源,采用MIT协议,允许商用,引发业界广泛关注。项目地址:
https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video

原文链接
本文链接:https://kx.umi6.com/article/27346.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
美团想另选一种命运
2025-03-22 08:06:21
王兴首次谈AI:美团策略是进攻而非防守,今年将推AI生活助手
2025-03-22 12:15:52
美团发布并开源混合专家模型:5600亿参数 只激活5%就有奇效
2025-09-01 13:18:39
国产AI让普通人也能当导演 字节Seedance 2.0获央视点赞
2026-02-14 23:51:12
视频生成模型大盘点:谁能定义下一代内容?
2025-08-07 20:57:55
OpenAI为期12天的活动开幕 AI应用端有望受到持续催化
2024-12-06 08:17:13
潞晨科技推出开源视频生成模型 Open-Sora 2.0,性能接近 OpenAI Sora
2025-03-13 14:24:23
美团开源虚拟人视频生成模型 LongCat-Video-Avatar:号称“不说话”时都像人
2025-12-18 19:07:22
字节即梦 AI 视频生成模型更新 P / S 2.0 Pro 双版本,全量开放使用
2024-11-15 19:03:43
王兴:美团已开发内部大模型 LongCat,AI 策略是主动进攻
2025-03-24 11:55:15
比肩Sora!视频模型王者Gen-3回归,能表现人类复杂感情,但不理解物理世界
2024-07-03 23:17:00
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1
2025-02-18 11:15:50
24小时热文
更多
扫一扫体验小程序