1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

美团最新开源的视频生成模型LongCat-Video,以13.6B参数量成为当前开源领域的SOTA(最佳性能)模型。这款模型支持文生视频、图生视频以及视频延长功能,能够生成长达数分钟的高质量视频,画质清晰且物理逻辑逼真。

官方演示中,无论是空中滑板、特效变身,还是第一视角骑行视频,LongCat-Video均展现了出色的真实感与一致性。其文生视频能力在开源模型中表现顶尖,甚至在部分维度可媲美谷歌闭源模型Veo3。而其长视频生成能力(稳定输出5分钟)更是被视为迈向AI视频终极形态的重要一步。

具体来看,LongCat-Video具备以下亮点:
1. 文生视频:支持720p、30fps高清生成,语义理解与视觉呈现达到开源SOTA水平,尤其擅长复杂场景如“水上芭蕾”。
2. 图生视频:能保留参考图像的主体属性和风格,适用于商业宣传或创意制作,例如机器人日常vlog。
3. 视频延长:通过提示词续写生成连续剧式长视频,解决了传统模型中常见的色彩漂移和质量下降问题。

技术上,LongCat-Video基于Diffusion Transformer(DiT)框架设计,统一处理多种任务,并采用块稀疏注意力、从粗到精生成范式等创新方法,提升效率与质量。此外,交互式生成支持让用户为不同片段设置独立指令,进一步增强了创作灵活性。

值得注意的是,美团近期在AI领域动作频频,从基础大模型LongCat-Flash系列到语音模型LongCat-Audio-Codec,再到现实场景Agent评测基准VitaBench,展现出跨界布局的决心。

LongCat-Video已开源,采用MIT协议,允许商用,引发业界广泛关注。项目地址:
https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video

原文链接
本文链接:https://kx.umi6.com/article/27346.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
字节跳动推出视频生成模型OmniHuman-1.5
2025-08-28 21:29:35
小而美的生活秘书!美团Agent落地生活服务
2025-09-13 13:26:00
美团核心本地商业CEO王莆中:在自有基础大模型上坚定投入 做出有特色的低推理成本模型
2026-03-13 17:35:05
美团终于上线了AI外卖助手
2024-06-07 21:27:04
王兴首次谈AI:美团策略是进攻而非防守,今年将推AI生活助手
2025-03-22 12:15:52
AGI-Eval团队:AI视频生成模型年度横评,Sora大饼落地,但国产模型仍然领先!
2025-01-06 09:16:55
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
2025-10-27 11:55:56
王兴:美团已开发内部大模型 LongCat,AI 策略是主动进攻
2025-03-24 11:55:15
潞晨科技推出开源视频生成模型Open-Sora 2.0
2025-03-13 15:25:51
消息称美团“All in AI”,王兴、王莆中双双看重
2025-02-10 18:16:21
美团旗下首款AI IDE产品CatPaw开启公测
2025-11-10 17:27:04
美团开源虚拟人视频生成模型 LongCat-Video-Avatar:号称“不说话”时都像人
2025-12-18 19:07:22
独家 | 刘炯接管 GN06 团队,向美团平台负责人李树斌汇报
2025-11-17 12:25:02
24小时热文
更多
扫一扫体验小程序