
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:Nano Banana不止能生图,视频生成才是新亮点
Nano Banana爆火后,催生了许多创意App,但大多数仅聚焦于图片编辑。Google副总裁Josh Woodward透露,Nano Banana为Gemini带来了千万新用户,完成了2亿次图像编辑。然而,图像编辑只是起点,用Nan...
原文链接
8月28日,字节跳动推出全新视频生成模型OmniHuman-1.5。该模型结合多模态大语言模型与扩散Transformer技术,模拟‘深思规划’与‘直觉反应’两种思维模式,可生成超一分钟的高质量动态视频,支持流畅镜头运动、复杂角色互动及高度动态动作表现。这一创新标志着视频生成领域的重要突破,为内容创作带来更多可能性。
原文链接
8月27日,爱诗科技发布新一代视频生成大模型PixVerse V5,上线首日吸引全球超百万用户更新体验。在Artificial Analysis测评中,PixVerse V5在图生视频领域排名全球Top2,文生视频位列Top3,稳居第一梯队。新版本搭载Agent创作助手,支持极速生成高质量视频(最快5秒)及多模态智能理解能力,降低创作门槛。用户青睐的创意模板包括“巨大宠物和小小人”等。截至目前,PixVerse全球用户突破1亿,累计生成超8亿视频,广泛应用于广告、电商等领域。
原文链接
8月27日,爱诗科技发布新一代视频生成大模型PixVerse V5,在权威测评中,图生视频排名全球Top2,文生视频位列Top3。同步上线的Agent创作助手大幅降低创作门槛,用户上传图片即可生成5-30秒短片。产品上线首日吸引超百万用户更新体验,刷新历代版本纪录。PixVerse(拍我AI)全球用户已突破1亿,累计生成超8亿个视频,广泛应用于广告、电商等领域。V5模型实现“秒级”生成,支持高质量1080P视频,提升动作自然度与光影还原能力,并具备多模态智能理解功能。此次升级推动AI视频从专业工具向大众创作普及。
原文链接
8月26日,阿里开源多模态视频生成模型通义万相Wan2.2-S2V。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致的电影级数字人视频,单次生成时长可达分钟级。这一技术突破为内容创作提供了高效工具,展现了AI在视频生成领域的潜力。
原文链接
8月26日,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、动作流畅的电影级数字人视频,单次生成时长可达分钟级,大幅提升视频创作效率。模型支持真人、卡通、动物等多类型图片及肖像、半身、全身画幅,还可通过文本控制丰富视频内容。例如,上传人物弹钢琴照片、歌曲和文字,可生成高质量演奏视频,手指动作与音频节奏完美匹配。技术上,Wan2.2-S2V融合音频驱动和文本引导机制,采用层次化帧压缩技术实现稳定长视频生成,训练数据集超60万个音视频片段。实测显示其在FID、EFID、CSIM等指标上领先同类模型。自今年2月以来,通义万相已开源多款模型,下载量超2000万。
原文链接
正文:2025年8月,全球首个接入GPT-5的视频Agent——Video Ocean发布,引发广泛关注。它通过一句话指令即可生成完整广告大片或解说视频,涵盖分镜、画面、配音、字幕等全流程,大幅缩短制作时间至数天甚至数分钟。相比传统AI视频工具只能生成单个镜头或依赖模板,Video Ocean实现从创意到成片的自动化生态系统,包含脚本策划、视觉合成和配音字幕三大模块,支持商业广告、品牌宣传片及专业影视内容创作。其操作简单,用户只需输入一句话,系统智能完成任务并支持修改调整。目前,Video Ocean已开放小范围邀请码,并在X、Reddit、YouTube等平台刷屏,成为AI视频生成领域新热点。
原文链接
2025年8月,可灵AI发布基于2.1模型的首尾帧功能,效果较1.6模型提升235%,在视频转场、视觉冲击力等方面表现突出。自2024年2月OpenAI推出Sora以来,快手、字节跳动等企业相继发布AI视频生成模型,生成式AI已在影视行业初步落地,应用于动画短片、特效场景等环节,并实现复杂场景生成与角色一致性。国元证券看好AI视频生成商业化前景,预计2024年全球规模达6.15亿美元,2032年增至25.63亿美元,复合增速20%。捷成股份与华为云合作探索视频大模型商用落地,中文在线结合“逍遥大模型”打造全流程广告投放系统。
原文链接
2025年8月,百度推出蒸汽机2.0视频生成大模型,主打多人有声音视频一体化生成。新版本擅长复杂运镜、电影级画质和精准中文语音对齐,并首创多模态潜在空间规划技术。用户可通过百度搜索“百度蒸汽机”或绘想平台体验,企业用户可在百度千帆大模型平台调用API服务。价格低至行业70%,限时优惠1.4元/5秒。发布会现场展示了多样化的应用场景,如科幻短片、品牌营销视频等,影视视效专家姚骐称其让好莱坞级镜头制作成本大幅降低。目前,该模型已在百度移动生态广泛落地,支持搜索、内容创作及商业营销等场景。
原文链接
自2024年起,AI生成视频技术迎来爆发式增长,以OpenAI的Sora为代表,突破了时长、清晰度与逻辑一致性等瓶颈。随后,Runway Gen-3、快手可灵等模型相继推出,2025年上半年更是呈现井喷趋势,阿里、字节等大厂及MiniMax等创业公司纷纷入局。尽管市场尚未形成头部垄断,但快手、字节等国内厂商在评测和用户使用率中位列第一梯队。AI大幅降低了视频制作成本,满足短视频需求,成为创作者增效工具。然而,模板化生产虽高效却难以创造经典内容,部分厂商如Runway转向高端影视领域,探索高质量生成模式,定义AI工具的使用边界仍是行业关键问题。
原文链接
加载更多

暂无内容