
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9月2日,腾讯正式发布混元3D世界模型系列新成员HunyuanWorld-Voyager(混元Voyager),为业界首个支持原生3D重建的超长漫游世界模型。该模型突破传统视频生成的空间一致性和范围限制,可生成长距离、世界一致的漫游场景,并支持视频直接导出为3D格式,适用于虚拟现实、物理仿真、游戏开发等领域。混元Voyager融合视频生成与3D建模优势,通过空间与特征结合实现原生3D记忆和场景重建,避免传统后处理延迟和精度损失。其在斯坦福大学WorldScore基准测试中综合能力排名第一,超越现有开源方法。相关源代码已上线GitHub和Hugging Face免费开放。
原文链接
8月15日,腾讯混元团队宣布推出混元3D世界模型的Lite版本。该版本大幅降低了运行所需的显存开销,使得用户能够在消费级显卡上进行部署。这一更新提升了模型的可用性和普及性,为更多开发者和用户提供了便利。
原文链接
8月15日,腾讯混元团队宣布推出3D世界模型1.0的Lite版本,通过动态FP8量化技术将显存需求从26GB降至17GB以下,成功适配消费级显卡。新版推理速度提升3倍以上,精度损失小于1%,并集成Cache算法优化冗余时间步,显著提升效率。该模型支持文字或图片输入生成高质量、可编辑的360度漫游场景,并可导出为3D mesh格式文件,适用于游戏开发、影视制作等领域。作为业界首个开源可编辑世界生成模型,其降低了3D内容创作门槛,解决了此前显存占用过高的问题,让更多中小企业和个人开发者能够便捷使用。官方地址已开放,包括官网、GitHub及Hugging Face等平台。
原文链接
2025年世界人工智能大会(WAIC)上,腾讯正式发布混元3D世界模型1.0,这是首个支持物理仿真的开源3D世界生成系统。该模型可通过文本或图像生成沉浸式、可交互的3D场景,具备360°沉浸体验、工业级兼容性和原子级交互三大核心优势。其创新技术包括全景代理生成、语义分层重建和长距离漫游拓展,能够高效生成高质量3D网格场景,适用于VR、游戏开发、物体编辑和物理仿真等领域。模型已开源,支持全球用户下载部署,项目地址与体验链接均已公布。
原文链接
2025年7月27日,在世界人工智能大会腾讯论坛上,腾讯正式发布并开源混元3D世界模型1.0。这是业界首个支持沉浸漫游、交互与仿真的世界生成模型,适用于游戏开发、VR及数字内容创作等领域。该模型融合全景视觉生成与分层3D重建技术,支持文字和图片输入,可在几分钟内生成高质量3D场景,大幅简化开发流程。其创新算法实现语意分层表征,兼容Unity、Unreal Engine等主流工具,并支持独立编辑与物理仿真。相比全球领先开源模型,混元3D在美学质量与指令遵循能力上全面超越。项目已上线,可通过官网或Hugging Face、GitHub访问体验。
原文链接
2025年7月27日,在世界人工智能大会腾讯论坛上,腾讯发布混元3D世界模型和具身智能平台Tairos(钛螺丝),首次展示AI时代产品应用全景图。该体系以“1+3+N”为核心,基于腾讯自研混元大模型,构建涵盖平台能力与多元应用的完整架构。覆盖B端与C端的智能体开发平台、机器人领域的具身智能开放平台,以及多行业场景中的AI应用与智能体产品矩阵,展现腾讯在AI领域的全面布局与技术创新。
原文链接
标题:谷歌推出“游戏版sora”:Genie 2模糊物理与数字世界界限
近日,谷歌DeepMind发布了最新基础世界模型Genie 2,可通过一张图像或文字描述生成3D场景,增加更复杂的交互功能。用户只需提供一张由Imagen 3生成的图像和文字描述,Genie 2就能生成可交互的3D环境,供用户自...
原文链接
昨晚,Google DeepMind 发布了新一代世界模型 Genie 2,该模型可以根据单张图像生成无限的3D世界,供人类或AI智能体游玩。此技术发布后引发广泛关注,被视为视频游戏的未来。Genie 2 能够生成丰富多样的3D环境,支持复杂角色动画、物理效果及NPC交互,还可通过键盘和鼠标操作进行控制。此外,DeepMind CEO 哈萨比斯还邀请马斯克共同开发AI游戏,显示出对技术的信心。Genie 2 有望推动具身智能体的研究,提供更广泛的训练环境。尽管仍在早期阶段,但谷歌认为Genie 2 是实现AGI的重要一步。与此同时,DeepMind 还发布了AI天气预测模型 GenCast,同样达到当前最佳水平。
原文链接
加载更多

暂无内容
AI热搜
更多
