
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4月17日,阿里通义万相宣布开源其自主研发的“首尾帧生视频模型”,这是业界首个百亿参数规模的开源首尾帧视频模型。该模型能够根据用户提供的首尾帧图片生成720p高清视频,并支持流畅过渡和自然动作生成。模型通过引入条件控制机制、优化训练策略及推理算法,在保持高精度的同时提高了生成效率。用户可通过官网免费体验或在GitHub、Hugging Face等平台下载模型进行二次开发。该技术可应用于特效变化、运镜控制等多种场景,例如生成四季交替或昼夜变化的延时摄影效果视频。开源地址已同步公布,包括Github、HuggingFace及魔搭社区。
原文链接
阿里将于今晚全面开源旗下视频生成模型万相2.1,该模型在视频生成和图像生成方面有显著提升。万相2.1首次实现了中文文字视频生成功能,并支持中英文一键生成艺术字及多种视频特效。该模型还支持复杂运镜,可还原真实世界的物理规律。此前,通义万相已支持文生视频、图生视频等多种功能。今晚开源值得关注。(2月25日)
原文链接
阿里旗下通义万相2.1版本于1月10日宣布升级,首次实现中文文字视频生成功能,支持无限长1080P视频的高效编解码。该版本提升了视频生成和图像生成两大能力,包括增强时空上下文建模能力和支持多种视频特效选项。此外,通义万相2.1还支持复杂运镜,能够还原真实世界的物理规律。新功能已在VBench榜单登顶。
原文链接
加载更多

暂无内容