综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月18日,美团LongCat团队正式发布并开源虚拟人视频生成模型LongCat-Video-Avatar。该模型基于LongCat-Video基座开发,支持Audio-Text-to-Video、Audio-Text-Image-to-Video及视频续写功能,在动作拟真度、长视频稳定性与身份一致性上实现突破。其技术亮点包括同步指挥嘴型、眼神、表情和肢体动作,以及在‘静音’状态下自然表现眨眼、调整坐姿等行为,赋予虚拟人更真实的生命力。据官方介绍,这是首个同时支持文字、图片、视频三种生成模式的全能模型,并在多个权威数据集评测中达到SOTA领先水平。项目已开源,可通过GitHub、Hugging Face及官方项目页面获取。
原文链接
加载更多
暂无内容