国产AI可以拍微电影了!4K、60帧高清画质,自带音效
国产AI正式将视频生成带入了有声电影时代。自从Sora引爆视频生成以来,几乎所有AI生成的视频都是“默片”。但现在,AI视频可以直接自带音效,而且是4K、60帧高清画质。
AI视频生成的水平如何?
我们使用国产AI制作了一部微电影,请观看视频:
这段视频是否已经有电影的感觉了?
这款国产AI的特点
这款名为“清影”的AI具有三大特点:
- 电影级效果:支持4K、60帧高清,10秒时长和任意比例视频。
- 模型能力全面提升:背后的CogVideoX模型更懂复杂提示,保持主体连贯性,效果更逼真。
- 自带音效:引入CogSound模型,自动根据视频内容生成匹配音效,本月将在清言APP上线。
制作流程
- 使用GLM 4 Plus生成微电影脚本。
- 生成高清图片,如开头片段。
- 在清影的图生视频界面上传图片并填写prompt,生成视频片段。
旁白部分
采用的是近期发布的GLM-4-Voice情感语音模型,效果宛如真人配音。
随意一段视频,秒出有声电影片段
CogSound性能测试
我们测试了CogSound对视频内容的理解能力和生成音效的效果。
Round 1:自然环境
测试了一段雨天傍晚房间内的视频,CogSound生成的音效包括雨声和鸟鸣,与视频内容完美契合。
Round 2:动物世界
测试了一段狮子妈妈和幼崽的视频,CogSound准确生成了狮子的叫声和鸟鸣声。
Round 3:多种乐器
测试了一段包含多种乐器演奏的视频,CogSound生成的音效包括萨克斯、钢琴等多种乐器声,音效层次分明。
Round 4:科幻电影
测试了一段《流浪地球》的视频片段,CogSound生成的音效几乎与电影原声无异,显示了其强大的音效生成能力。
先进技术支撑
CogVideoX模型采用了因果3D卷积、专家自适应层归一化等技术,确保生成视频的连贯性和细节。CogSound则通过潜空间扩散模型和块级时间对齐交叉注意力机制,实现了音效与视频的高度同步。
短视频迈入AI时代
多模态是通往AGI的必经之路,智谱通过发布CogSound和即将发布的CogMusic,全面掌握了视频生成中的“音”这块。这意味着现在做短视频,只要有想法就能实现。
总结
国产AI已具备制作高质量微电影的能力,操作简便,只需几步就能生成带有音效的高清视频。这标志着短视频制作进入了AI时代。
原文链接
本文链接:https://kx.umi6.com/article/8471.html
转载请注明文章出处
相关推荐
.png)
换一换
首个接入GPT-5的视频Agent!一句话生成广告大片,分镜配音全包了
2025-08-26 16:47:05
一夜之间,AI视频生产格局大变天?
2024-06-13 10:56:53
年包70万挖人、出海精准撒钱,中国公司与Sora短兵相接
2024-12-18 15:39:58
全球最快AI视频生成火了,5秒让老黄马斯克拥抱,Made in China
2025-02-24 14:23:16
消息称字节跳动 AI 视频生成产品“即梦”考虑接入 DeepSeek
2025-02-26 08:22:32
Runway 发布 AI 视频生成模型 Gen-4:可保持角色、场景高度一致性
2025-04-01 09:16:38
腾讯AI大牛,被曝投身视频生成创业
2024-11-20 14:13:10
字节AI高管骆怡航任清华系公司生数科技CEO,原CEO发文:人生就是不停地告别
2025-03-12 13:25:58
视频大模型激战180天:Sora“高冷隐身”,国产巨头狂卷落地
2024-07-11 08:33:40
MiniMax将收购深圳AI视频生成创企鹿影科技
2025-03-14 09:01:19
这是我花9毛钱拍的《Meta老板砸钱把我从苹果挖走》
2025-07-14 14:23:28
MiniMax秀了波AI视频杂技:越看越惊艳,指令遵循太强了
2025-06-18 11:35:51
Midjourney 推出其首个 AI 视频生成模型 V1:支持图像转视频 + 21 秒最长时长
2025-06-19 09:47:52
475 文章
172734 浏览
24小时热文
更多

-
2025-09-09 00:06:37
-
2025-09-09 00:05:10
-
2025-09-08 23:04:48