1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

美团最新开源的视频生成模型LongCat-Video,以13.6B参数量成为当前开源领域的SOTA(最佳性能)模型。这款模型支持文生视频、图生视频以及视频延长功能,能够生成长达数分钟的高质量视频,画质清晰且物理逻辑逼真。

官方演示中,无论是空中滑板、特效变身,还是第一视角骑行视频,LongCat-Video均展现了出色的真实感与一致性。其文生视频能力在开源模型中表现顶尖,甚至在部分维度可媲美谷歌闭源模型Veo3。而其长视频生成能力(稳定输出5分钟)更是被视为迈向AI视频终极形态的重要一步。

具体来看,LongCat-Video具备以下亮点:
1. 文生视频:支持720p、30fps高清生成,语义理解与视觉呈现达到开源SOTA水平,尤其擅长复杂场景如“水上芭蕾”。
2. 图生视频:能保留参考图像的主体属性和风格,适用于商业宣传或创意制作,例如机器人日常vlog。
3. 视频延长:通过提示词续写生成连续剧式长视频,解决了传统模型中常见的色彩漂移和质量下降问题。

技术上,LongCat-Video基于Diffusion Transformer(DiT)框架设计,统一处理多种任务,并采用块稀疏注意力、从粗到精生成范式等创新方法,提升效率与质量。此外,交互式生成支持让用户为不同片段设置独立指令,进一步增强了创作灵活性。

值得注意的是,美团近期在AI领域动作频频,从基础大模型LongCat-Flash系列到语音模型LongCat-Audio-Codec,再到现实场景Agent评测基准VitaBench,展现出跨界布局的决心。

LongCat-Video已开源,采用MIT协议,允许商用,引发业界广泛关注。项目地址:
https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video

原文链接
本文链接:https://kx.umi6.com/article/27346.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
美团AI编程工具“NoCode”即将上线:让编程“像点外卖一样简单”
2025-05-20 15:49:13
60秒内生成5秒AI视频 豆包视频生成模型Seaweed上线即梦AI
2024-11-08 18:32:50
字节跳动 OmniHuman 多模态视频生成模型即将上线,图片 + 音频便可生成视频
2025-02-07 18:02:50
王兴首次谈AI:美团策略是进攻而非防守,今年将推AI生活助手
2025-03-22 12:15:52
美团旗下首款AI IDE产品CatPaw开启公测
2025-11-10 17:27:04
豆包发布视频生成模型Seedance1.0 pro
2025-06-11 12:13:43
港大字节最新视频生成模型刷屏!网友直接RIP市场营销,Sora也不香了
2025-02-11 08:37:44
硅基流动完成新一轮亿元人民币融资 美团成战略股东
2025-02-19 20:59:33
美团低空物流公司成立科技新公司 含AI软件开发业务
2024-12-13 14:27:32
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
2025-09-01 13:16:16
美团新独立APP,点不了菜只能点AI
2025-11-03 12:17:52
比肩Sora!视频模型王者Gen-3回归,能表现人类复杂感情,但不理解物理世界
2024-07-03 23:17:00
消息称美团“All in AI”,王兴、王莆中双双看重
2025-02-10 18:16:21
24小时热文
更多
扫一扫体验小程序