9月19日,阿里通义万相发布全新动作生成模型Wan2.2-Animate并开源。该模型支持驱动人物、动漫及动物照片,可应用于短视频创作、舞蹈模板生成等领域。相比前代Animate Anyone,新模型在人物一致性、生成质量等方面大幅提升,同时支持角色模仿和角色扮演两种模式。角色模仿可迁移视频中的动作和表情至图片角色,角色扮演则替换视频角色为图片角色,保留环境与动作。团队构建大规模人物视频数据集进行后训练,采用骨骼信号和隐式特征实现精准复刻,并设计光照融合LoRA优化效果。实测显示,其性能超越StableAnimator、LivePortrait等开源模型及部分闭源模型。用户可通过Github、HuggingFace、魔搭社区或阿里云百炼平台获取模型和代码。
原文链接
本文链接:https://kx.umi6.com/article/25526.html
转载请注明文章出处
相关推荐
换一换
开源版Genie3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
2025-08-19 10:59:13
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
群核科技发布空间大模型,或解决视频生成时空一致性难题
2025-08-26 14:47:34
面壁智能 AgentCPM-Explore 小模型开源:仅 4B 参数,挑战端侧智能体部署
2026-01-14 15:42:31
智谱 GLM-4.7-Flash 模型发布并开源,可免费调用
2026-01-20 09:47:20
智谱上线并开源文本转语音模型 GLM-TTS:只需 3 秒语音样本即可克隆声音
2025-12-11 10:42:18
消息称 Meta 正讨论放弃开源 AI 模型 Behemoth,转向闭源战略
2025-07-15 15:46:36
腾讯混元世界模型 1.1 版本发布并开源:单卡即可部署,秒级创造 3D 世界
2025-10-22 18:50:23
腾讯混元开源视频音效生成模型
2025-08-28 16:29:54
腾讯智能体框架 Youtu-Agent 开源,搭建 Agent 只需两步
2025-09-02 16:34:48
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
阿里巴巴开源视频生成模型通义万相 Wan2.2,首创电影美学控制系统
2025-07-28 21:19:42
666 文章
433587 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44