12月4日,《科创板日报》报道,腾讯混元大模型正式上线视频生成能力,成为继文生文、文生图、3D生成后的又一业务进展。该模型参数量达130亿,是当前最大的视频开源模型。用户只需输入描述,即可生成中英文双语、多尺寸、多清晰度的视频。目前,该模型已上线腾讯元宝APP,供用户在“AI视频”板块试用,企业用户则可通过腾讯云接入。 自OpenAI的Sora提升了长视频生成效果后,全球AI厂商纷纷加入视频生成热潮。腾讯混元在视频生成方面具有超写实画质、高度符合提示词的流畅画面等优势。此外,混元大模型基于DiT架构进行升级,采用新一代文本编码器、统一全注意力机制和先进的图像视频混合VAE,显著提升了细节表现力。尽管快手、抖音等公司已推出相应产品并商业化,腾讯混元更注重开源和用户使用体验,以推动模型优化。现阶段,腾讯暂无具体商业化计划,但混元大模型已可用于工业级商业场景,如广告宣传、动画制作等。模型已在Hugging Face和GitHub上开源,供开发者免费使用。
原文链接
本文链接:https://kx.umi6.com/article/9644.html
转载请注明文章出处
相关推荐
换一换
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理SOTA
2025-07-29 15:31:43
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
持续拥抱开源 腾讯混元一口气开源四款小尺寸模型 最小仅0.5B
2025-08-04 18:06:55
单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2
2025-06-04 14:20:36
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
创想三维接入腾讯混元,3D 打印进入 AI 建模时代
2025-08-11 21:08:06
Altman对话YC总裁:OpenAI的开源模型将远超期待
2025-06-23 10:30:02
美国“SPAC之王”查马斯:公司已转用Kimi K2
2025-10-11 19:32:28
OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”
2025-06-11 09:03:41
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
576 文章
345527 浏览
24小时热文
更多
-
2025-12-08 20:48:29 -
2025-12-08 20:47:34 -
2025-12-08 20:45:30