10月22日,腾讯混元发布并开源混元世界模型1.1版本(WorldMirror)。新版本支持多视图及视频输入,单卡即可部署,可秒级生成3D世界。相比7月发布的1.0版本,1.1版突破了仅支持文本或单图输入的局限,首次实现多模态先验注入与多任务统一输出,支持点云、深度、相机等多种3D几何预测。模型已完全开源,开发者可通过GitHub一键部署,普通用户也可在HuggingFace Space在线体验实时3D渲染功能。相关资源已在官网及技术报告中提供。
原文链接
本文链接:https://kx.umi6.com/article/27131.html
转载请注明文章出处
相关推荐
换一换
“会操作手机的 AI”,智谱开源 AI Agent 模型 AutoGLM
2025-12-09 10:29:51
Databricks 呼吁美国 AI 行业拥抱开源:这是中国能够领先的关键因素
2025-11-15 15:55:27
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
英伟达开源9B参数小模型,比Qwen3快6倍
2025-08-19 16:03:42
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
群核科技发布空间大模型,或解决视频生成时空一致性难题
2025-08-26 14:47:34
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
智谱上线并开源文本转语音模型 GLM-TTS:只需 3 秒语音样本即可克隆声音
2025-12-11 10:42:18
睿尔曼开源全球首个高质量、模态数量最多的真机数据集
2025-11-24 20:12:19
小扎改口不开源,Meta股价暴涨12%
2025-08-01 08:56:20
智谱 GLM-4.7-Flash 模型发布并开源,可免费调用
2026-01-20 09:47:20
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
650 文章
452669 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18