通义万相 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

阿里发布通义万相2.6系列模型

12月16日，阿里发布通义万相2.6系列模型，面向专业影视制作和图像创作场景全面升级。这是国内首个支持角色扮演功能的视频模型，同时具备音画同步、多镜头生成及声音驱动等能力。万相2.6已上线阿里云百炼平台及万相官网，为创作者提供更强大的工具支持。

原文链接

Nebula

12-16 15:52:19

角色扮演

通义万相

音画同步

分享至

打开微信扫一扫

内容投诉

生成图片

阿里千问 App 上线 Wan2.5 视频模型与 Qwen-Image 满血版，用户可免费体验

12月2日，阿里千问App上线通义万相Wan2.5视频模型和Qwen-Image满血版，用户可免费体验。通义万相Wan2.5是国内最强视频生成模型之一，支持音画同步，能通过一张照片和文字生成10秒1080P高清唱跳视频，适配真人、萌宠、二次元等多种场景。Qwen-Image为全球最强开源图像编辑模型，具备多视角转换、图像融合等能力，可精准修改图片文字、生成商用级海报，尤其在亚洲人像和中文处理上表现更佳。此次升级为用户带来全新AI创作工具，抢先体验功能已开放。

原文链接

电子诗篇

12-02 12:11:18

Qwen-Image

千问App

通义万相

分享至

打开微信扫一扫

内容投诉

生成图片

真假难辨！阿里AI实时换脸直播：男人秒变美女

2025年7月，阿里开源的视频生成模型通义万相Wan2.2近日在海外引发热议。推主Lord Bebo分享的演示视频展示了其强大的实时换脸功能，可将用户的声音和动作映射到另一张面孔上，生成以假乱真的数字替身。该模型通过一张图片和音频即可生成高质量动态视频，支持多种画幅及卡通、动物等形象，动态表现稳定自然，对光影、色彩等电影级视觉控制能力尤为突出。此外，其语义理解和指令遵循能力显著增强，能更好还原创作意图。这一技术突破为内容创作带来全新可能，也引发了关于真实与虚假界限的讨论。

原文链接

虚拟微光

10-31 17:43:03

实时换脸

数字替身

通义万相Wan2.2

分享至

打开微信扫一扫

内容投诉

生成图片

阿里夸克发布AI创作平台“造点”，通义万相Wan2.5生成视频7天免费

9月24日，阿里巴巴旗下夸克发布全新AI创作平台“造点”，集成AI生图与AI生视频能力，率先接入通义万相Wan2.5，是国内首个支持音画同步视频生成的平台。平台支持10秒高清视频生成，包含人声、音效和背景音乐，适配电影级创作需求；同时引入Midjourney V7模型，擅长亚洲人像、中文文字及国风元素生成，满足电商、影视等专业场景。即日起至9月30日，用户可限时7天免费体验Wan2.5视频生成功能。平台还提供轻量化创作工具，如“一句话P图”“风格转换”等，适合普通用户日常使用。内测期间已诞生多个爆款创意作品，创作者评价其画质细腻稳定，效率显著提升。访问 zaodian.quark.cn 或夸克APP即可体验。

原文链接

GhostPilot

09-24 17:50:29

Midjourney V7

通义万相Wan2.5

造点

分享至

打开微信扫一扫

内容投诉

生成图片

Wan2.5+Midjourney V7，阿里夸克这个新AI鲨疯了！价格还砍一大刀

正文：2025年9月24日，阿里夸克发布全新AI创作平台“造点”，集成Wan2.5与Midjourney V7两大顶尖模型，主打AI生图与生视频功能。平台支持图片生成、视频生成、音效匹配及P图编辑等多场景应用，率先实现国内首个音视频同步生成服务。用户可免费体验7天，会员价格降至48元/月，仅为海外版一半。移动端支持对话式图片编辑，提供丰富模板与创意玩法，包括3D手办生成、风格转绘等。平台已上线，限时优惠活动截止至9月30日。

原文链接

未来笔触

09-24 13:39:19

Midjourney V7

夸克造点

通义万相Wan2.5

分享至

打开微信扫一扫

内容投诉

生成图片

通义万相全新动作生成模型开源

9月19日，通义万相正式开源全新动作生成模型Wan2.2-Animate。该模型可驱动人物、动漫形象及动物照片，广泛适用于短视频创作、舞蹈模板生成和动漫制作等领域。用户即日起可通过Github、HuggingFace和魔搭社区下载模型与代码，或在阿里云百炼平台调用API，亦可在通义万相官网直接体验这一功能。

原文链接

虚拟微光

09-19 15:17:03

动作生成模型

开源

通义万相

分享至

打开微信扫一扫

内容投诉

生成图片

上传一张图、主演任何视频，“性能最强动作生成模型”阿里通义万相 Wan2.2-Animate 开源

9月19日，阿里通义万相发布全新动作生成模型Wan2.2-Animate并开源。该模型支持驱动人物、动漫及动物照片，可应用于短视频创作、舞蹈模板生成等领域。相比前代Animate Anyone，新模型在人物一致性、生成质量等方面大幅提升，同时支持角色模仿和角色扮演两种模式。角色模仿可迁移视频中的动作和表情至图片角色，角色扮演则替换视频角色为图片角色，保留环境与动作。团队构建大规模人物视频数据集进行后训练，采用骨骼信号和隐式特征实现精准复刻，并设计光照融合LoRA优化效果。实测显示，其性能超越StableAnimator、LivePortrait等开源模型及部分闭源模型。用户可通过Github、HuggingFace、魔搭社区或阿里云百炼平台获取模型和代码。

原文链接

AI奇点纪元

09-19 15:14:57

动作生成模型

开源

通义万相

分享至

打开微信扫一扫

内容投诉

生成图片

阿里开源视频生成模型Wan2.2-S2V

8月26日，阿里开源多模态视频生成模型通义万相Wan2.2-S2V。该模型仅需一张静态图片和一段音频，即可生成面部表情自然、口型一致的电影级数字人视频，单次生成时长可达分钟级。这一技术突破为内容创作提供了高效工具，展现了AI在视频生成领域的潜力。

原文链接

电子诗篇

08-26 22:55:59

视频生成模型

通义万相

阿里开源

分享至

打开微信扫一扫

内容投诉

生成图片

一张图即可生成电影级数字人视频：阿里云通义万相 Wan2.2-S2V 视频生成模型宣布开源

8月26日，阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V。该模型仅需一张静态图片和一段音频，即可生成面部表情自然、口型一致、动作流畅的电影级数字人视频，单次生成时长可达分钟级，大幅提升视频创作效率。模型支持真人、卡通、动物等多类型图片及肖像、半身、全身画幅，还可通过文本控制丰富视频内容。例如，上传人物弹钢琴照片、歌曲和文字，可生成高质量演奏视频，手指动作与音频节奏完美匹配。技术上，Wan2.2-S2V融合音频驱动和文本引导机制，采用层次化帧压缩技术实现稳定长视频生成，训练数据集超60万个音视频片段。实测显示其在FID、EFID、CSIM等指标上领先同类模型。自今年2月以来，通义万相已开源多款模型，下载量超2000万。

原文链接

AI创想团

08-26 22:53:42

视频生成模型

通义万相

音频驱动

分享至

打开微信扫一扫

内容投诉

生成图片

阿里发布通义 Wan2.2-I2V-Flash 模型：推理速度比 Wan2.1 提升 12 倍，图生视频更轻快

8月11日，阿里通义发布Wan2.2-I2V-Flash模型，推理速度较Wan2.1提升12倍，价格为0.1元/秒。新模型在电影级视觉呈现、指令遵循能力、风格稳定性及动态效果上均有显著优化，并支持精准运镜和特效提示词直出。该模型已上线阿里云百炼平台，可通过API调用体验。此前7月28日，阿里开源通义万相Wan2.2系列，包括文生视频、图生视频及统一视频生成三款模型，均为业界首个使用MoE架构的视频生成模型，参数量达27B，激活参数14B，同时首创电影美学控制系统，光影与微表情等媲美专业水准。

原文链接