1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

智谱清影正式上线,加入AI视频生成赛道,生成6秒视频仅需30秒。作为国内超200亿估值大模型公司中首家发布视频生成成果的创业团队,智谱凭借快速的多模态能力成长,展示了在多模态算法与算力储备上的实力。此前,智谱在文本与检索领域表现出色,而这次在视频生成上,智谱率先推出基于大模型的文本到视频生成模型CogVideoX,实现了从文字到视频的高效转换。

智谱清影在功能上支持PC、APP及小程序,提供6秒视频生成服务,且分辨率高达1440p。用户只需输入一段文字,选择风格,如卡通3D、黑白、油画、电影感等,再叠加音乐,即可生成视频。同步推出的图生视频功能涵盖表情包梗图、广告制作、剧情创作、短视频创作等,其中“老照片动起来”小程序能将黑白老照片转化为动态视频,并自动上色。

生成视频类型主要在风景、动物、超现实、人文历史等领域表现较好,支持皮克斯风格、卡通风格、摄影风格、动漫风格等视频风格选择,近景效果最佳。提示词作为关键因素,直接影响生成视频的效果,为此,智谱提供了智能体辅助生成更清晰的提示词。

目前,清影在首发测试期间免费使用,但生成视频需排队等待1分钟以上,VIP通道则需购买加速包,费用为5元解锁一天(24小时)高速通道或199元解锁一年高速通道。

此外,智谱成为国内首个面向开发者开放视频生成大模型的厂商,通过CogVideoX的开放平台,开发者可通过调用API体验文生视频及图生视频模型能力。

智谱团队自研的视频生成大模型CogVideoX依托高效的三维变分自编码器结构、因果三维卷积模型、端到端的视频理解模型、以及将文本、时间、空间三个维度融合的transformer架构,解决了内容连贯性问题,提高了生成视频的质量。同时,智谱还自研了3D RoPE位置编码模块,更有利于捕捉帧间关系,建立视频中的长程依赖。

智谱在多模态大模型领域积累了深厚的实力,自2021年起先后推出了文生图大模型CogView、文生视频大模型CogVideo等,持续推动多模态大模型的发展。未来,智谱将继续探索更高效的模型架构,以提高视频生成的真实感和质量,满足用户需求。

原文链接
本文链接:https://kx.umi6.com/article/4306.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
最强前端编程渲染:OpenAI o3-alpha 曝光,力压 Sonnet、Grok4 等 AI 顶流模型
2025-07-19 09:50:33
AI 智能体竞赛迈入新阶段,浏览器成“兵家必争之地”
2025-07-19 11:52:20
经济学家示警:AI 投资崩盘隐忧,泡沫规模远超“互联网泡沫”
2025-07-19 14:56:08
24小时热文
更多
扫一扫体验小程序