赛道正在变得拥挤腾讯混元大模型杀入文生视频让用户 “用起来”是关键

2024-12-04 09:36:34

Journeyman

发布在

快讯

阅读：1800

12月4日，《科创板日报》报道，腾讯混元大模型正式上线视频生成能力，成为继文生文、文生图、3D生成后的又一业务进展。该模型参数量达130亿，是当前最大的视频开源模型。用户只需输入描述，即可生成中英文双语、多尺寸、多清晰度的视频。目前，该模型已上线腾讯元宝APP，供用户在“AI视频”板块试用，企业用户则可通过腾讯云接入。自OpenAI的Sora提升了长视频生成效果后，全球AI厂商纷纷加入视频生成热潮。腾讯混元在视频生成方面具有超写实画质、高度符合提示词的流畅画面等优势。此外，混元大模型基于DiT架构进行升级，采用新一代文本编码器、统一全注意力机制和先进的图像视频混合VAE，显著提升了细节表现力。尽管快手、抖音等公司已推出相应产品并商业化，腾讯混元更注重开源和用户使用体验，以推动模型优化。现阶段，腾讯暂无具体商业化计划，但混元大模型已可用于工业级商业场景，如广告宣传、动画制作等。模型已在Hugging Face和GitHub上开源，供开发者免费使用。

原文链接

本文链接：https://kx.umi6.com/article/9644.html

转载请注明文章出处

开源模型