1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

国产AI可以拍微电影了!4K、60帧高清画质,自带音效

国产AI正式将视频生成带入了有声电影时代。自从Sora引爆视频生成以来,几乎所有AI生成的视频都是“默片”。但现在,AI视频可以直接自带音效,而且是4K、60帧高清画质。

AI视频生成的水平如何?

我们使用国产AI制作了一部微电影,请观看视频:

微电影示例

这段视频是否已经有电影的感觉了?

这款国产AI的特点

这款名为“清影”的AI具有三大特点:

  1. 电影级效果:支持4K、60帧高清,10秒时长和任意比例视频。
  2. 模型能力全面提升:背后的CogVideoX模型更懂复杂提示,保持主体连贯性,效果更逼真。
  3. 自带音效:引入CogSound模型,自动根据视频内容生成匹配音效,本月将在清言APP上线。

制作流程

  1. 使用GLM 4 Plus生成微电影脚本。
  2. 生成高清图片,如开头片段。
  3. 在清影的图生视频界面上传图片并填写prompt,生成视频片段。

旁白部分

采用的是近期发布的GLM-4-Voice情感语音模型,效果宛如真人配音。

随意一段视频,秒出有声电影片段

CogSound性能测试

我们测试了CogSound对视频内容的理解能力和生成音效的效果。

Round 1:自然环境

测试了一段雨天傍晚房间内的视频,CogSound生成的音效包括雨声和鸟鸣,与视频内容完美契合。

Round 2:动物世界

测试了一段狮子妈妈和幼崽的视频,CogSound准确生成了狮子的叫声和鸟鸣声。

Round 3:多种乐器

测试了一段包含多种乐器演奏的视频,CogSound生成的音效包括萨克斯、钢琴等多种乐器声,音效层次分明。

Round 4:科幻电影

测试了一段《流浪地球》的视频片段,CogSound生成的音效几乎与电影原声无异,显示了其强大的音效生成能力。

先进技术支撑

CogVideoX模型采用了因果3D卷积、专家自适应层归一化等技术,确保生成视频的连贯性和细节。CogSound则通过潜空间扩散模型和块级时间对齐交叉注意力机制,实现了音效与视频的高度同步。

短视频迈入AI时代

多模态是通往AGI的必经之路,智谱通过发布CogSound和即将发布的CogMusic,全面掌握了视频生成中的“音”这块。这意味着现在做短视频,只要有想法就能实现。

总结

国产AI已具备制作高质量微电影的能力,操作简便,只需几步就能生成带有音效的高清视频。这标志着短视频制作进入了AI时代。

原文链接
本文链接:https://kx.umi6.com/article/8471.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Runway发布Gen-3,AI视频生成领域卷死了?
2024-06-18 11:50:02
消息称字节跳动 AI 视频生成产品“即梦”考虑接入 DeepSeek
2025-02-26 08:22:32
谷歌领跑 AI 视频生成赛道:抢先 OpenAI Sora 推出 Veo 模型,可生成 1080P 高清视频
2024-12-05 08:56:42
24小时热文
更多
扫一扫体验小程序