1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月4日,《科创板日报》报道,腾讯混元大模型正式上线视频生成能力,成为继文生文、文生图、3D生成后的又一业务进展。该模型参数量达130亿,是当前最大的视频开源模型。用户只需输入描述,即可生成中英文双语、多尺寸、多清晰度的视频。目前,该模型已上线腾讯元宝APP,供用户在“AI视频”板块试用,企业用户则可通过腾讯云接入。 自OpenAI的Sora提升了长视频生成效果后,全球AI厂商纷纷加入视频生成热潮。腾讯混元在视频生成方面具有超写实画质、高度符合提示词的流畅画面等优势。此外,混元大模型基于DiT架构进行升级,采用新一代文本编码器、统一全注意力机制和先进的图像视频混合VAE,显著提升了细节表现力。尽管快手、抖音等公司已推出相应产品并商业化,腾讯混元更注重开源和用户使用体验,以推动模型优化。现阶段,腾讯暂无具体商业化计划,但混元大模型已可用于工业级商业场景,如广告宣传、动画制作等。模型已在Hugging Face和GitHub上开源,供开发者免费使用。

原文链接
本文链接:https://kx.umi6.com/article/9644.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
谷歌最强文生视频模型 Veo 3.1 首批样本曝光:自带配乐、8 秒 720P,剑指 Sora 2
2025-10-11 10:08:32
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
大模型年终观察,如何定义2025年的「好模型」?
2025-12-22 21:00:44
DeepSeek的一次小更新:暴打OpenAI 追上Gemini
2025-12-03 00:44:54
在史上最大规模WAIC中寻找DeepSeek
2025-07-28 09:10:59
蚂蚁集团发布万亿参数旗舰模型 Ling-1T 并开源,多项指标位居开源模型榜首
2025-10-11 09:36:05
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
2025-08-11 13:01:00
昆仑万维发布并开源 Skywork-R1V 3.0,多模态推理能力逼近人类专家水平
2025-07-09 11:04:18
10 万亿 tokens!英伟达贡献全球最大规模开源数据集,并推四大开源 AI 模型
2026-01-06 06:48:15
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
腾讯混元 0.5B、1.8B、4B、7B 模型开源发布,消费级显卡即可运行
2025-08-04 15:58:47
HuggingChat Omni 集成式 AI 平台发布,可针对用户指令从百款开源模型库中挑选最适合回答
2025-10-18 10:30:57
24小时热文
更多
扫一扫体验小程序