1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月26日,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、动作流畅的电影级数字人视频,单次生成时长可达分钟级,大幅提升视频创作效率。模型支持真人、卡通、动物等多类型图片及肖像、半身、全身画幅,还可通过文本控制丰富视频内容。例如,上传人物弹钢琴照片、歌曲和文字,可生成高质量演奏视频,手指动作与音频节奏完美匹配。技术上,Wan2.2-S2V融合音频驱动和文本引导机制,采用层次化帧压缩技术实现稳定长视频生成,训练数据集超60万个音视频片段。实测显示其在FID、EFID、CSIM等指标上领先同类模型。自今年2月以来,通义万相已开源多款模型,下载量超2000万。

原文链接
本文链接:https://kx.umi6.com/article/24239.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里通义万相视觉生成大模型升级,支持文生视频、图生视频等
2024-09-19 16:54:30
今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了
2025-01-09 12:54:09
字节视频生成模型 PixelDance上线即梦AI,用户可免费体验
2024-11-18 22:29:52
昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1
2025-02-18 11:15:50
智谱 AI 开源 CogVideoX 视频生成模型:“清影”同源,单张 4090 显卡可推理
2024-08-06 13:21:18
拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?
2025-06-20 17:04:19
视频生成模型大盘点:谁能定义下一代内容?
2025-08-07 20:57:55
阿里开源视频生成模型Wan2.2-S2V
2025-08-26 22:55:59
字节即梦 AI 视频生成模型更新 P / S 2.0 Pro 双版本,全量开放使用
2024-11-15 19:03:43
Sora/可灵/海螺/混元大PK!多场景对比,谁是最强视频生成模型?
2024-12-11 17:28:14
阿里巴巴开源视频生成模型通义万相 Wan2.2,首创电影美学控制系统
2025-07-28 21:19:42
字节即梦将在Sora发布前上线视频生成模型PixelDance
2024-11-14 20:30:33
字节视频生成模型PixelDance上线即梦AI:用户可免费体验
2024-11-16 00:11:12
24小时热文
更多
扫一扫体验小程序