国产AI可以拍微电影了!4K、60帧高清画质,自带音效
国产AI正式将视频生成带入了有声电影时代。自从Sora引爆视频生成以来,几乎所有AI生成的视频都是“默片”。但现在,AI视频可以直接自带音效,而且是4K、60帧高清画质。
AI视频生成的水平如何?
我们使用国产AI制作了一部微电影,请观看视频:
这段视频是否已经有电影的感觉了?
这款国产AI的特点
这款名为“清影”的AI具有三大特点:
- 电影级效果:支持4K、60帧高清,10秒时长和任意比例视频。
- 模型能力全面提升:背后的CogVideoX模型更懂复杂提示,保持主体连贯性,效果更逼真。
- 自带音效:引入CogSound模型,自动根据视频内容生成匹配音效,本月将在清言APP上线。
制作流程
- 使用GLM 4 Plus生成微电影脚本。
- 生成高清图片,如开头片段。
- 在清影的图生视频界面上传图片并填写prompt,生成视频片段。
旁白部分
采用的是近期发布的GLM-4-Voice情感语音模型,效果宛如真人配音。
随意一段视频,秒出有声电影片段
CogSound性能测试
我们测试了CogSound对视频内容的理解能力和生成音效的效果。
Round 1:自然环境
测试了一段雨天傍晚房间内的视频,CogSound生成的音效包括雨声和鸟鸣,与视频内容完美契合。
Round 2:动物世界
测试了一段狮子妈妈和幼崽的视频,CogSound准确生成了狮子的叫声和鸟鸣声。
Round 3:多种乐器
测试了一段包含多种乐器演奏的视频,CogSound生成的音效包括萨克斯、钢琴等多种乐器声,音效层次分明。
Round 4:科幻电影
测试了一段《流浪地球》的视频片段,CogSound生成的音效几乎与电影原声无异,显示了其强大的音效生成能力。
先进技术支撑
CogVideoX模型采用了因果3D卷积、专家自适应层归一化等技术,确保生成视频的连贯性和细节。CogSound则通过潜空间扩散模型和块级时间对齐交叉注意力机制,实现了音效与视频的高度同步。
短视频迈入AI时代
多模态是通往AGI的必经之路,智谱通过发布CogSound和即将发布的CogMusic,全面掌握了视频生成中的“音”这块。这意味着现在做短视频,只要有想法就能实现。
总结
国产AI已具备制作高质量微电影的能力,操作简便,只需几步就能生成带有音效的高清视频。这标志着短视频制作进入了AI时代。
原文链接
本文链接:https://kx.umi6.com/article/8471.html
转载请注明文章出处
相关推荐
.png)
换一换
Runway发布Gen-3,AI视频生成领域卷死了?
2024-06-18 11:50:02
消息称字节跳动 AI 视频生成产品“即梦”考虑接入 DeepSeek
2025-02-26 08:22:32
谷歌领跑 AI 视频生成赛道:抢先 OpenAI Sora 推出 Veo 模型,可生成 1080P 高清视频
2024-12-05 08:56:42
425 文章
65741 浏览
24小时热文
更多

-
2025-07-20 12:02:31
-
2025-07-20 10:03:13
-
2025-07-20 10:02:01