国产AI可以拍微电影了!4K、60帧高清画质,自带音效
国产AI正式将视频生成带入了有声电影时代。自从Sora引爆视频生成以来,几乎所有AI生成的视频都是“默片”。但现在,AI视频可以直接自带音效,而且是4K、60帧高清画质。
AI视频生成的水平如何?
我们使用国产AI制作了一部微电影,请观看视频:
这段视频是否已经有电影的感觉了?
这款国产AI的特点
这款名为“清影”的AI具有三大特点:
- 电影级效果:支持4K、60帧高清,10秒时长和任意比例视频。
- 模型能力全面提升:背后的CogVideoX模型更懂复杂提示,保持主体连贯性,效果更逼真。
- 自带音效:引入CogSound模型,自动根据视频内容生成匹配音效,本月将在清言APP上线。
制作流程
- 使用GLM 4 Plus生成微电影脚本。
- 生成高清图片,如开头片段。
- 在清影的图生视频界面上传图片并填写prompt,生成视频片段。
旁白部分
采用的是近期发布的GLM-4-Voice情感语音模型,效果宛如真人配音。
随意一段视频,秒出有声电影片段
CogSound性能测试
我们测试了CogSound对视频内容的理解能力和生成音效的效果。
Round 1:自然环境
测试了一段雨天傍晚房间内的视频,CogSound生成的音效包括雨声和鸟鸣,与视频内容完美契合。
Round 2:动物世界
测试了一段狮子妈妈和幼崽的视频,CogSound准确生成了狮子的叫声和鸟鸣声。
Round 3:多种乐器
测试了一段包含多种乐器演奏的视频,CogSound生成的音效包括萨克斯、钢琴等多种乐器声,音效层次分明。
Round 4:科幻电影
测试了一段《流浪地球》的视频片段,CogSound生成的音效几乎与电影原声无异,显示了其强大的音效生成能力。
先进技术支撑
CogVideoX模型采用了因果3D卷积、专家自适应层归一化等技术,确保生成视频的连贯性和细节。CogSound则通过潜空间扩散模型和块级时间对齐交叉注意力机制,实现了音效与视频的高度同步。
短视频迈入AI时代
多模态是通往AGI的必经之路,智谱通过发布CogSound和即将发布的CogMusic,全面掌握了视频生成中的“音”这块。这意味着现在做短视频,只要有想法就能实现。
总结
国产AI已具备制作高质量微电影的能力,操作简便,只需几步就能生成带有音效的高清视频。这标志着短视频制作进入了AI时代。
原文链接
本文链接:https://kx.umi6.com/article/8471.html
转载请注明文章出处
相关推荐
换一换
AI视频突飞猛进这一年,国产之光可灵AI笑到最后
2024-12-30 19:24:50
AI 视频背后的“豪赌”:消息称 OpenAI Sora 日均烧钱 1500 万美元
2025-11-11 21:30:11
玩了半天Sora APP,我发现了这些比抖音“上头”的新玩法
2025-10-01 13:43:45
全球最快AI视频生成火了,5秒让老黄马斯克拥抱,Made in China
2025-02-24 14:23:16
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
2024-11-08 16:24:36
谷歌憋大招:Gemini 将内嵌 AI 视频生成,让人人都能是导演
2025-02-19 09:44:57
爱诗科技完成6000万美元B轮融资,阿里巴巴领投
2025-09-10 09:31:39
今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了
2025-01-09 12:54:09
大模型走到AI战略分岔口,字节们面临偏航危机
2024-10-28 11:21:12
MiniMax将收购深圳AI视频生成创企鹿影科技
2025-03-14 09:01:19
Midjourney 推出其首个 AI 视频生成模型 V1:支持图像转视频 + 21 秒最长时长
2025-06-19 09:47:52
谷歌领跑 AI 视频生成赛道:抢先 OpenAI Sora 推出 Veo 模型,可生成 1080P 高清视频
2024-12-05 08:56:42
一夜之间,AI视频生产格局大变天?
2024-06-13 10:56:53
569 文章
336557 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57