Genie - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

重塑虚实边界：智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

重塑虚实边界：智元机器人发布Genie Sim 3.0开源仿真平台智元机器人在CES国际消费电子展上发布了首个大语言模型驱动的开源仿真平台——Genie Sim 3.0。基于NVIDIA Isaac Sim，该平台融合三维重建与视觉生成技术，打造高保真数字孪生环境，支持自然语言驱动的场景生成，并开...

原文链接

星际Code流浪者

01-07 16:18:26

Genie Sim 3.0

大语言模型驱动

开源仿真平台

分享至

打开微信扫一扫

内容投诉

生成图片

智元发布开源仿真平台Genie Sim 3.0

1月7日，在CES国际消费电子展首日，智元发布开源仿真平台Genie Sim 3.0。该平台基于NVIDIA Isaac Sim，融合三维重建与视觉生成技术，实现数字孪生级高保真环境，并首创大语言模型驱动的场景泛化技术，可快速生成万级场景。智元同步开源了包含真机作业场景的上万小时仿真数据集，构建覆盖10万+场景的多维度智能评估体系，为模型能力提供全景画像。目前，所有仿真资产、数据集及自动化评测源代码均已完全开源，助力行业创新与技术发展。

原文链接

电子诗篇

01-07 13:10:47

Genie Sim 3.0

开源仿真平台

智元

分享至

打开微信扫一扫

内容投诉

生成图片

智元发布第二代一体化具身大小脑系统 GenieReasoner，推理能力达 SOTA

正文：2026年1月1日，智元具身研究中心发布第二代一体化具身大小脑系统GenieReasoner，其推理能力达SOTA水平。新系统通过统一离散化预训练和流匹配技术，解决了VLA模型中语义推理与动作控制的模态对齐难题，并突破了传统离散Tokenizer的动作精度瓶颈。同时，研究中心开源了聚焦真机操控全流程的具身推理评测基准ERIQ，用于量化评估VLA模型的推理能力。实验表明，GenieReasoner在跨本体真机实验中展现了卓越的泛化性，显著提升端到端动作执行表现。未来，团队将从逻辑深度与执行精度两方面推进，致力于实现具身大小脑、世界模型与真机强化学习的闭环协同。

原文链接

数据炼金师

01-01 18:27:20

GenieReasoner

SOTA

具身推理

分享至

打开微信扫一扫

内容投诉

生成图片

深度解析谷歌Genie 3：“一句话，创造一个世界”

标题：谷歌Genie 3：“一句话，创造一个世界” 想象一下，只需对电脑说一句话：“一个雨后湿滑的赛博朋克城市，霓虹灯在水坑中闪烁”，几秒钟后，你便能驾驶飞行器，在这个为你生成的世界里自由穿梭。这不是科幻，而是谷歌DeepMind最新发布的Genie 3为我们揭示的未来。 Genie 3并非...

原文链接

阿达旻

08-18 17:50:45

Genie 3

世界模型

通用人工智能

分享至

打开微信扫一扫

内容投诉

生成图片

刚刚！谷歌内部揭秘Genie 3：Sora后最强AI爆款，开启世界模型新时代

2025年8月18日，谷歌DeepMind发布最新世界模型Genie 3，被称为Sora后最强AI爆款。Genie 3可通过文本生成动态、可交互的世界，支持每秒24帧、720p分辨率，并具备长达一分钟的空间记忆能力。其物理模拟和一致性表现惊艳，如水花、光照等效果逼真，甚至能记住角色刷墙痕迹。研究团队表示，Genie 3是通向通用人工智能（AGI）和具身智能体的关键一步，未来将开放模型。此外，Genie 3为机器人研究提供无限虚拟场景，推动真实感与交互性发展。团队认为，完全模拟现实世界仍有差距，但已迈出重要一步。

原文链接

智能视野

08-18 16:52:32

AGI

Genie 3

世界模型

分享至

打开微信扫一扫

内容投诉

生成图片

智元推出行业首个机器人世界模型开源平台 Genie Envisioner

8月15日，智元机器人推出行业首个面向真实世界机器人操控的开源平台Genie Envisioner（GE）。该平台通过闭环架构整合未来帧预测、策略学习与仿真评估，实现从视觉理解到动作执行的端到端推理。基于3000小时真机数据，GE在跨平台泛化和长时序任务上超越现有技术，并仅需少量数据即可完成跨平台迁移。团队宣布开源全部代码、预训练模型及评测工具，推动机器人从被动执行向主动‘想象—验证—行动’转变，为智能制造和服务机器人应用开辟新路径。

原文链接

未来编码者

08-15 09:10:41

Genie Envisioner

开源平台

智元机器人

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌推出Genie3：世界模型的ChatGPT时刻？

2025年8月5日，Google DeepMind发布Genie 3，一款基于文本提示生成可互动3D环境的世界模型。该模型以720p分辨率、24帧/秒实时生成场景，支持用户自由移动和动态修改环境（如天气、角色等），并在数分钟内保持物理一致性。相比前代Genie 2，新版本在连贯性、真实性和交互时长上显著提升，为AI代理训练提供丰富模拟环境。尽管仍存在动作空间有限、多智能体互动不完善等局限，Genie 3被视作迈向通用人工智能（AGI）的重要一步，并可能颠覆游戏开发与机器人训练领域。目前，DeepMind将其作为研究预览，向部分学者和创作者开放测试，探索其潜在应用与风险。

原文链接

E-Poet

08-06 20:37:25

Genie 3

世界模型

实时交互

分享至

打开微信扫一扫

内容投诉

生成图片

一天内海外AI大模型接连上新还有“重大发布”蓄势待发

8月6日，谷歌、OpenAI、Anthropic等公司在AI大模型领域接连发布更新。谷歌推出Genie 3，首个支持实时交互的世界模型，可生成720p画面并保持数分钟一致性，突破性加入‘视觉记忆’功能，适用于游戏、机器人及自动驾驶场景。Anthropic发布Claude Opus 4.1，提升编码与推理能力，在SWE-bench测试中表现优于前代。OpenAI推出两款开放权重模型GPT-oss-120b和GPT-oss-20b，可在本地运行，并预告GPT-5即将发布。此外，Anthropic也计划未来几周内推出重大改进。国内方面，Kimi、智谱、Qwen3等公司相继迭代模型，强化Agent与推理能力。分析师指出，国内外大模型正拓展智能边界，开源与闭源策略并行，模型即Agent的范式逐渐显现。

原文链接

代码编织者

08-06 12:33:38

AI大模型

Claude Opus 4.1

Genie 3

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌发布世界模型Genie 3

【2025年8月6日】谷歌DeepMind发布最新世界模型Genie 3，可生成支持实时互动的3D环境。新模型显著提升了用户与虚拟世界的交互时长，并具备记忆功能，能准确记录物体位置，即便用户移开视线后仍能精准定位。这一突破为沉浸式体验和虚拟场景应用带来全新可能性，进一步推动AI技术在动态环境生成领域的发展。

原文链接

心智奇点

08-06 09:28:52

Genie 3

世界模型

谷歌

分享至

打开微信扫一扫

内容投诉

生成图片

恐替代你的岗位：谷歌迈步通用人工智能，AI 世界模型 Genie 3 登场

8月5日，谷歌DeepMind发布名为Genie 3的“世界模型”，向通用人工智能（AGI）迈出重要一步。该模型允许AI系统与逼真的现实模拟互动，可用于训练机器人和自动驾驶车辆。其核心能力包括模拟物理特性、自然世界、动画场景、历史环境等，同时支持实时交互和长时程一致性。此外，Genie 3还引入了基于文本提示的世界事件功能，可动态改变模拟环境。尽管尚未全面公开，谷歌展示了滑雪和仓库场景，模拟质量与最新视频模型Veo 3相当，但持续时间更长。专家认为，此类模型或将取代某些白领岗位，是开发自主系统的突破性技术。

原文链接