国产AI可以拍微电影了!4K、60帧高清画质,自带音效
国产AI正式将视频生成带入了有声电影时代。自从Sora引爆视频生成以来,几乎所有AI生成的视频都是“默片”。但现在,AI视频可以直接自带音效,而且是4K、60帧高清画质。
AI视频生成的水平如何?
我们使用国产AI制作了一部微电影,请观看视频:
这段视频是否已经有电影的感觉了?
这款国产AI的特点
这款名为“清影”的AI具有三大特点:
- 电影级效果:支持4K、60帧高清,10秒时长和任意比例视频。
- 模型能力全面提升:背后的CogVideoX模型更懂复杂提示,保持主体连贯性,效果更逼真。
- 自带音效:引入CogSound模型,自动根据视频内容生成匹配音效,本月将在清言APP上线。
制作流程
- 使用GLM 4 Plus生成微电影脚本。
- 生成高清图片,如开头片段。
- 在清影的图生视频界面上传图片并填写prompt,生成视频片段。
旁白部分
采用的是近期发布的GLM-4-Voice情感语音模型,效果宛如真人配音。
随意一段视频,秒出有声电影片段
CogSound性能测试
我们测试了CogSound对视频内容的理解能力和生成音效的效果。
Round 1:自然环境
测试了一段雨天傍晚房间内的视频,CogSound生成的音效包括雨声和鸟鸣,与视频内容完美契合。
Round 2:动物世界
测试了一段狮子妈妈和幼崽的视频,CogSound准确生成了狮子的叫声和鸟鸣声。
Round 3:多种乐器
测试了一段包含多种乐器演奏的视频,CogSound生成的音效包括萨克斯、钢琴等多种乐器声,音效层次分明。
Round 4:科幻电影
测试了一段《流浪地球》的视频片段,CogSound生成的音效几乎与电影原声无异,显示了其强大的音效生成能力。
先进技术支撑
CogVideoX模型采用了因果3D卷积、专家自适应层归一化等技术,确保生成视频的连贯性和细节。CogSound则通过潜空间扩散模型和块级时间对齐交叉注意力机制,实现了音效与视频的高度同步。
短视频迈入AI时代
多模态是通往AGI的必经之路,智谱通过发布CogSound和即将发布的CogMusic,全面掌握了视频生成中的“音”这块。这意味着现在做短视频,只要有想法就能实现。
总结
国产AI已具备制作高质量微电影的能力,操作简便,只需几步就能生成带有音效的高清视频。这标志着短视频制作进入了AI时代。
原文链接
本文链接:https://kx.umi6.com/article/8471.html
转载请注明文章出处
相关推荐
换一换
爱诗科技完成B+轮1亿元融资,ARR突破4000万美金
2025-10-17 15:18:14
给我一张脸,视频背景随你换,林黛玉都被清华理工男玩废了|免费开放
2024-09-11 13:25:16
FramePack 降低 AI 视频生成硬件门槛,6GB 显存即可生成 60 秒视频
2025-04-20 08:05:04
腾讯AI大牛,被曝投身视频生成创业
2024-11-20 14:13:10
刚刚,OpenAI发布Sora2,AI视频GPT-3.5时刻来了,还有一个超好玩的app
2025-10-01 07:40:29
谷歌憋大招:Gemini 将内嵌 AI 视频生成,让人人都能是导演
2025-02-19 09:44:57
动漫神级工具诞生!日本首个AI视频生成平台Animon:3分钟高效出片
2025-05-20 15:48:08
谈“AI抖音”尚早,Sora 2们会先改变影视行业
2025-10-04 09:57:52
国产AI视频产品在海外杀疯了!
2024-10-23 14:38:34
这个真人版《火影忍者》竟然是AI做的,来自中国AI视频新王者Vidu Q3
2026-01-30 20:46:17
视频生成的“ChatGPT时刻”究竟有没有到来?
2024-07-26 14:44:17
字节跳动 AI 助手豆包被曝开启视频生成内测
2024-11-07 12:58:54
这是我花9毛钱拍的《Meta老板砸钱把我从苹果挖走》
2025-07-14 14:23:28
672 文章
548982 浏览
24小时热文
更多
-
2026-04-25 00:42:43 -
2026-04-24 23:43:31 -
2026-04-24 23:42:26