虚拟人视频生成模型

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

美团开源虚拟人视频生成模型 LongCat-Video-Avatar：号称“不说话”时都像人

12月18日，美团LongCat团队正式发布并开源虚拟人视频生成模型LongCat-Video-Avatar。该模型基于LongCat-Video基座开发，支持Audio-Text-to-Video、Audio-Text-Image-to-Video及视频续写功能，在动作拟真度、长视频稳定性与身份一致性上实现突破。其技术亮点包括同步指挥嘴型、眼神、表情和肢体动作，以及在‘静音’状态下自然表现眨眼、调整坐姿等行为，赋予虚拟人更真实的生命力。据官方介绍，这是首个同时支持文字、图片、视频三种生成模式的全能模型，并在多个权威数据集评测中达到SOTA领先水平。项目已开源，可通过GitHub、Hugging Face及官方项目页面获取。

原文链接