
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:谷歌Genie 3:“一句话,创造一个世界”
想象一下,只需对电脑说一句话:“一个雨后湿滑的赛博朋克城市,霓虹灯在水坑中闪烁”,几秒钟后,你便能驾驶飞行器,在这个为你生成的世界里自由穿梭。这不是科幻,而是谷歌DeepMind最新发布的Genie 3为我们揭示的未来。
Genie 3并非...
原文链接
2025年8月18日,谷歌DeepMind发布最新世界模型Genie 3,被称为Sora后最强AI爆款。Genie 3可通过文本生成动态、可交互的世界,支持每秒24帧、720p分辨率,并具备长达一分钟的空间记忆能力。其物理模拟和一致性表现惊艳,如水花、光照等效果逼真,甚至能记住角色刷墙痕迹。研究团队表示,Genie 3是通向通用人工智能(AGI)和具身智能体的关键一步,未来将开放模型。此外,Genie 3为机器人研究提供无限虚拟场景,推动真实感与交互性发展。团队认为,完全模拟现实世界仍有差距,但已迈出重要一步。
原文链接
8月15日,智元机器人推出行业首个面向真实世界机器人操控的开源平台Genie Envisioner(GE)。该平台通过闭环架构整合未来帧预测、策略学习与仿真评估,实现从视觉理解到动作执行的端到端推理。基于3000小时真机数据,GE在跨平台泛化和长时序任务上超越现有技术,并仅需少量数据即可完成跨平台迁移。团队宣布开源全部代码、预训练模型及评测工具,推动机器人从被动执行向主动‘想象—验证—行动’转变,为智能制造和服务机器人应用开辟新路径。
原文链接
2025年8月5日,Google DeepMind发布Genie 3,一款基于文本提示生成可互动3D环境的世界模型。该模型以720p分辨率、24帧/秒实时生成场景,支持用户自由移动和动态修改环境(如天气、角色等),并在数分钟内保持物理一致性。相比前代Genie 2,新版本在连贯性、真实性和交互时长上显著提升,为AI代理训练提供丰富模拟环境。尽管仍存在动作空间有限、多智能体互动不完善等局限,Genie 3被视作迈向通用人工智能(AGI)的重要一步,并可能颠覆游戏开发与机器人训练领域。目前,DeepMind将其作为研究预览,向部分学者和创作者开放测试,探索其潜在应用与风险。
原文链接
8月6日,谷歌、OpenAI、Anthropic等公司在AI大模型领域接连发布更新。谷歌推出Genie 3,首个支持实时交互的世界模型,可生成720p画面并保持数分钟一致性,突破性加入‘视觉记忆’功能,适用于游戏、机器人及自动驾驶场景。Anthropic发布Claude Opus 4.1,提升编码与推理能力,在SWE-bench测试中表现优于前代。OpenAI推出两款开放权重模型GPT-oss-120b和GPT-oss-20b,可在本地运行,并预告GPT-5即将发布。此外,Anthropic也计划未来几周内推出重大改进。国内方面,Kimi、智谱、Qwen3等公司相继迭代模型,强化Agent与推理能力。分析师指出,国内外大模型正拓展智能边界,开源与闭源策略并行,模型即Agent的范式逐渐显现。
原文链接
【2025年8月6日】谷歌DeepMind发布最新世界模型Genie 3,可生成支持实时互动的3D环境。新模型显著提升了用户与虚拟世界的交互时长,并具备记忆功能,能准确记录物体位置,即便用户移开视线后仍能精准定位。这一突破为沉浸式体验和虚拟场景应用带来全新可能性,进一步推动AI技术在动态环境生成领域的发展。
原文链接
8月5日,谷歌DeepMind发布名为Genie 3的“世界模型”,向通用人工智能(AGI)迈出重要一步。该模型允许AI系统与逼真的现实模拟互动,可用于训练机器人和自动驾驶车辆。其核心能力包括模拟物理特性、自然世界、动画场景、历史环境等,同时支持实时交互和长时程一致性。此外,Genie 3还引入了基于文本提示的世界事件功能,可动态改变模拟环境。尽管尚未全面公开,谷歌展示了滑雪和仓库场景,模拟质量与最新视频模型Veo 3相当,但持续时间更长。专家认为,此类模型或将取代某些白领岗位,是开发自主系统的突破性技术。
原文链接
4月21日,智元机器人推出行业首款具身智能开发平台Genie Studio。该平台涵盖数据采集、模型训练、仿真评测及模型推理全链路功能,支持高效数据采集与管理,单机日产能达1000条。平台提供自研及主流开源模型,降低训练门槛,并具备6000+仿真物体资产与场景,实现专家轨迹获取及结果可视化。此外,Genie Studio支持“一键真机部署”,单卡推理性能提升2-3倍,助力算法从云端到实体机器人的无缝迁移,推动具身智能规模化落地。
原文链接
标题:谷歌推出“游戏版sora”:Genie 2模糊物理与数字世界界限
近日,谷歌DeepMind发布了最新基础世界模型Genie 2,可通过一张图像或文字描述生成3D场景,增加更复杂的交互功能。用户只需提供一张由Imagen 3生成的图像和文字描述,Genie 2就能生成可交互的3D环境,供用户自...
原文链接
**摘要:**
12月5日,《科创板日报》报道,谷歌DeepMind发布了大型基础世界模型Genie 2,该模型能通过单张图片或文字描述生成3D场景,具有可交互性和空间记忆能力。Genie 2可在1分钟内生成高质量的3D环境,并支持用户通过鼠标和键盘进行探索。与前“AI教母”李飞飞的World Labs相比,Genie 2侧重于游戏制作,而World Labs更专注于影视制作。DeepMind CEO Demis Hassabis邀请马斯克共同开发AI游戏,马斯克回应“Cool”。Genie 2的应用不仅限于娱乐,还可为具身智能体的研究提供大量虚拟训练数据。谷歌研究人员展示了Genie 2在处理复杂指令时的强大功能,认为该模型有望解锁具身智能体的新能力。
(注:摘要长度为249字)
原文链接
加载更多

暂无内容