12月18日,美团LongCat团队正式发布并开源虚拟人视频生成模型LongCat-Video-Avatar。该模型基于LongCat-Video基座开发,支持Audio-Text-to-Video、Audio-Text-Image-to-Video及视频续写功能,在动作拟真度、长视频稳定性与身份一致性上实现突破。其技术亮点包括同步指挥嘴型、眼神、表情和肢体动作,以及在‘静音’状态下自然表现眨眼、调整坐姿等行为,赋予虚拟人更真实的生命力。据官方介绍,这是首个同时支持文字、图片、视频三种生成模式的全能模型,并在多个权威数据集评测中达到SOTA领先水平。项目已开源,可通过GitHub、Hugging Face及官方项目页面获取。
原文链接
本文链接:https://kx.umi6.com/article/30445.html
转载请注明文章出处
相关推荐
换一换
王兴:美团已开发内部大模型 LongCat,AI 策略是主动进攻
2025-03-24 11:55:15
美团发布高效推理模型LongCat-Flash-Thinking
2025-09-22 14:58:11
美团正研发 NativeAI 产品,目标让人人都有“专属的生活小秘书”
2025-03-24 21:15:21
硅基流动完成新一轮亿元人民币融资 美团成战略股东
2025-02-19 20:59:33
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
美团王兴,中国具身智能第一投资人
2025-07-14 10:16:02
美团CEO王兴:将继续加大投资开发大语言模型
2025-05-26 21:54:46
独家 | 刘炯接管 GN06 团队,向美团平台负责人李树斌汇报
2025-11-17 12:25:02
美团在AI投入超百亿元
2025-06-26 12:21:04
美团低空物流公司成立科技新公司 含AI软件开发业务
2024-12-13 14:27:32
美团发布首款AI Agent产品“小美”App
2025-09-12 10:12:46
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
2025-09-01 13:16:16
美团等入股硅基流动 后者为生成式AI设施提供商
2025-03-12 14:29:34
702 文章
587509 浏览
24小时热文
更多
-
2026-04-24 12:12:33 -
2026-04-24 12:11:28 -
2026-04-24 12:10:22