综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年1月,Runway发布全新视频生成模型Gen 4.5,其逼真效果引发热议。该模型在镜头控制、叙事连贯性及角色一致性上表现突出,能生成包含近景、中景和远景的多镜头视频,细节处理接近真实摄影水准。调查显示,在1000名参与者中,仅57.1%的人能分辨AI生成视频与真实视频的区别。此外,当前视频生成技术正快速升级,行业趋势包括提升真实度、声画同步能力以及支持更长视频生成时间。Runway的更新标志着AI视频生成进入更高水平,商业化应用前景可期。
原文链接
12月16日,阿里发布新一代万相2.6系列模型,面向专业影视制作与图像创作场景升级,是国内首个支持角色扮演功能的视频模型。该模型具备音画同步、多镜头生成及声音驱动等能力,被称为全球功能最全的视频生成模型。目前,万相2.6已同步上线阿里云百炼平台及万相官网,为用户提供更高效的创作工具。(记者 黄心怡)
原文链接
Midjourney发布首个视频模型V1,虽不卷分辨率和长镜头,但凭借精准调色和高辨识度风格收获好评。用户可通过“Animate”按钮将图像转为视频,默认生成4段5秒视频,最长可达21秒。视频功能已纳入现有订阅体系(10美元/月),但存在功能限制,如无音效、时间轴编辑及API接入支持,且分辨率仅480p。尽管如此,其独特的氛围感和流畅动态受到认可,从日式电车站到极光雪地场景均展现高质量生成效果。Midjourney目标是构建“世界模型”,视频模型为其重要阶段性成果,未来还将推出3D模型与实时系统。
原文链接
标题:不是视频模型“学习”慢,而是LLM走捷径|18万引大牛Sergey Levine
闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
为什么语言模型能从预测下一个词中学到很多,而视频模型却从预测下一帧中学到很少?UC伯克利大学计算机副教授Sergey Levine提出了这一疑问。他曾...
原文链接
过去一个月,随着Sora正式开放,视频模型赛道进入新一轮竞争。谷歌推出Veo 2,国内的可灵、Minimax也更新。Sora虽曾惊艳,但在正式发布后遭吐槽,表现不如新发布的视频模型。
笔者选取了腾讯元宝、字节即梦AI、快手可灵AI、生数科技Vidu 1.5、Pixverse、海螺AI(MiniMax...
原文链接
把Runway、Luma们一锅端了!这款视频模型上“杀手级”功能:一致性魔咒终于打破
三张图攒一个毫无违和感的视频!
视频模型领域再掀波澜,国产视频模型Vidu凭借其新功能“多主体一致性”打破了业界难题。
多主体一致性功能
Vidu的新功能支持上传1~3张参照图,以实现对多主体的精准控制。例如,上传...
原文链接
6月13日,视频生成模型Dream Machine由Luma AI在X平台开放免费试用,可在120秒内生成120帧高质量视频,适用于5秒以内的内容,支持电影级效果与摄像机运动同步。然而,模型尚存瑕疵,如视角切换时的物体变形、部分动作不连贯等问题。Luma AI承诺持续优化。
原文链接
6月6日,人工智能初创公司Pika宣布获得8000万美元B轮融资,估值达到4.7亿美元,Spark Capital领投,还包括Greycroft、Lightspeed Venture Partners及音乐人Jared Leto等。Pika专注生成式视频模型,其创始人Demi Guo和Chenlin Meng休学创业。Pika的AI视频制作软件已上线,用户通过文本、图片或视频生成短视频,近期计划进行重大升级,支持更高质量、长时间视频,并提升角色一致性。目前Pika拥有数百万用户,但具体数字未透露。
原文链接
加载更多
暂无内容