12月4日,《科创板日报》报道,腾讯混元大模型正式上线视频生成能力,成为继文生文、文生图、3D生成后的又一业务进展。该模型参数量达130亿,是当前最大的视频开源模型。用户只需输入描述,即可生成中英文双语、多尺寸、多清晰度的视频。目前,该模型已上线腾讯元宝APP,供用户在“AI视频”板块试用,企业用户则可通过腾讯云接入。 自OpenAI的Sora提升了长视频生成效果后,全球AI厂商纷纷加入视频生成热潮。腾讯混元在视频生成方面具有超写实画质、高度符合提示词的流畅画面等优势。此外,混元大模型基于DiT架构进行升级,采用新一代文本编码器、统一全注意力机制和先进的图像视频混合VAE,显著提升了细节表现力。尽管快手、抖音等公司已推出相应产品并商业化,腾讯混元更注重开源和用户使用体验,以推动模型优化。现阶段,腾讯暂无具体商业化计划,但混元大模型已可用于工业级商业场景,如广告宣传、动画制作等。模型已在Hugging Face和GitHub上开源,供开发者免费使用。
原文链接
本文链接:https://kx.umi6.com/article/9644.html
转载请注明文章出处
相关推荐
换一换
Moltbot作者被Claude刁难后:MiniMax M2.1是最优秀的开源模型
2026-01-29 14:21:07
100万亿Token揭示今年AI趋势,硅谷的这份报告火了
2025-12-09 14:39:59
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
在国际比赛中拿下 30 个第 1 名,腾讯混元开源轻量级翻译模型 Hunyuan-MT-7B
2025-09-01 19:23:51
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
腾讯混元发布混元图像3.0图生图模型
2026-01-26 13:11:25
HuggingChat Omni 集成式 AI 平台发布,可针对用户指令从百款开源模型库中挑选最适合回答
2025-10-18 10:30:57
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
可玩转千余款游戏,英伟达联合斯坦福等研发 NitroGen 开源模型
2025-12-21 11:38:39
美国“SPAC之王”查马斯:公司已转用Kimi K2
2025-10-11 19:32:28
谷歌前 CEO 施密特:大多数国家最终可能使用中国的 AI 模型
2025-11-12 16:13:53
Kimi K2.5发布24小时登顶全球开源榜单
2026-01-28 20:37:16
634 文章
451466 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22