1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

美团最新开源的视频生成模型LongCat-Video,以13.6B参数量成为当前开源领域的SOTA(最佳性能)模型。这款模型支持文生视频、图生视频以及视频延长功能,能够生成长达数分钟的高质量视频,画质清晰且物理逻辑逼真。

官方演示中,无论是空中滑板、特效变身,还是第一视角骑行视频,LongCat-Video均展现了出色的真实感与一致性。其文生视频能力在开源模型中表现顶尖,甚至在部分维度可媲美谷歌闭源模型Veo3。而其长视频生成能力(稳定输出5分钟)更是被视为迈向AI视频终极形态的重要一步。

具体来看,LongCat-Video具备以下亮点:
1. 文生视频:支持720p、30fps高清生成,语义理解与视觉呈现达到开源SOTA水平,尤其擅长复杂场景如“水上芭蕾”。
2. 图生视频:能保留参考图像的主体属性和风格,适用于商业宣传或创意制作,例如机器人日常vlog。
3. 视频延长:通过提示词续写生成连续剧式长视频,解决了传统模型中常见的色彩漂移和质量下降问题。

技术上,LongCat-Video基于Diffusion Transformer(DiT)框架设计,统一处理多种任务,并采用块稀疏注意力、从粗到精生成范式等创新方法,提升效率与质量。此外,交互式生成支持让用户为不同片段设置独立指令,进一步增强了创作灵活性。

值得注意的是,美团近期在AI领域动作频频,从基础大模型LongCat-Flash系列到语音模型LongCat-Audio-Codec,再到现实场景Agent评测基准VitaBench,展现出跨界布局的决心。

LongCat-Video已开源,采用MIT协议,允许商用,引发业界广泛关注。项目地址:
https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video

原文链接
本文链接:https://kx.umi6.com/article/27346.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
字节即梦 AI 视频生成模型更新 P / S 2.0 Pro 双版本,全量开放使用
2024-11-15 19:03:43
王兴首次谈AI:美团策略是进攻而非防守,今年将推AI生活助手
2025-03-22 12:15:52
美团内测万亿级新一代大模型,全程基于国产算力集群训练
2026-04-24 12:12:33
火山引擎发布豆包视频生成模型Seedance 1.0 lite
2025-05-13 15:58:04
视频生成模型大盘点:谁能定义下一代内容?
2025-08-07 20:57:55
字节跳动推出视频生成模型OmniHuman-1.5
2025-08-28 21:29:35
OpenAI为期12天的活动开幕 AI应用端有望受到持续催化
2024-12-06 08:17:13
硅基流动完成新一轮亿元人民币融资 美团成战略股东
2025-02-19 20:59:33
消息称美团“All in AI”,王兴、王莆中双双看重
2025-02-10 18:16:21
王兴:美团已开发内部大模型 LongCat,AI 策略是主动进攻
2025-03-24 11:55:15
小而美的生活秘书!美团Agent落地生活服务
2025-09-13 13:26:00
二次元狂喜!海螺发布2D动画专用视频生成模型,日漫迪士尼插画风都支持
2024-12-09 15:27:23
视频生成界的大瓜:Runway 组织公司全员,把互联网扒了个干干净净
2024-07-26 23:07:39
24小时热文
更多
扫一扫体验小程序