
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:谷歌Genie 3:“一句话,创造一个世界”
想象一下,只需对电脑说一句话:“一个雨后湿滑的赛博朋克城市,霓虹灯在水坑中闪烁”,几秒钟后,你便能驾驶飞行器,在这个为你生成的世界里自由穿梭。这不是科幻,而是谷歌DeepMind最新发布的Genie 3为我们揭示的未来。
Genie 3并非...
原文链接
2025年8月18日,谷歌DeepMind发布最新世界模型Genie 3,被称为Sora后最强AI爆款。Genie 3可通过文本生成动态、可交互的世界,支持每秒24帧、720p分辨率,并具备长达一分钟的空间记忆能力。其物理模拟和一致性表现惊艳,如水花、光照等效果逼真,甚至能记住角色刷墙痕迹。研究团队表示,Genie 3是通向通用人工智能(AGI)和具身智能体的关键一步,未来将开放模型。此外,Genie 3为机器人研究提供无限虚拟场景,推动真实感与交互性发展。团队认为,完全模拟现实世界仍有差距,但已迈出重要一步。
原文链接
2025年8月5日,Google DeepMind发布Genie 3,一款基于文本提示生成可互动3D环境的世界模型。该模型以720p分辨率、24帧/秒实时生成场景,支持用户自由移动和动态修改环境(如天气、角色等),并在数分钟内保持物理一致性。相比前代Genie 2,新版本在连贯性、真实性和交互时长上显著提升,为AI代理训练提供丰富模拟环境。尽管仍存在动作空间有限、多智能体互动不完善等局限,Genie 3被视作迈向通用人工智能(AGI)的重要一步,并可能颠覆游戏开发与机器人训练领域。目前,DeepMind将其作为研究预览,向部分学者和创作者开放测试,探索其潜在应用与风险。
原文链接
8月6日,谷歌、OpenAI、Anthropic等公司在AI大模型领域接连发布更新。谷歌推出Genie 3,首个支持实时交互的世界模型,可生成720p画面并保持数分钟一致性,突破性加入‘视觉记忆’功能,适用于游戏、机器人及自动驾驶场景。Anthropic发布Claude Opus 4.1,提升编码与推理能力,在SWE-bench测试中表现优于前代。OpenAI推出两款开放权重模型GPT-oss-120b和GPT-oss-20b,可在本地运行,并预告GPT-5即将发布。此外,Anthropic也计划未来几周内推出重大改进。国内方面,Kimi、智谱、Qwen3等公司相继迭代模型,强化Agent与推理能力。分析师指出,国内外大模型正拓展智能边界,开源与闭源策略并行,模型即Agent的范式逐渐显现。
原文链接
【2025年8月6日】谷歌DeepMind发布最新世界模型Genie 3,可生成支持实时互动的3D环境。新模型显著提升了用户与虚拟世界的交互时长,并具备记忆功能,能准确记录物体位置,即便用户移开视线后仍能精准定位。这一突破为沉浸式体验和虚拟场景应用带来全新可能性,进一步推动AI技术在动态环境生成领域的发展。
原文链接
8月5日,谷歌DeepMind发布名为Genie 3的“世界模型”,向通用人工智能(AGI)迈出重要一步。该模型允许AI系统与逼真的现实模拟互动,可用于训练机器人和自动驾驶车辆。其核心能力包括模拟物理特性、自然世界、动画场景、历史环境等,同时支持实时交互和长时程一致性。此外,Genie 3还引入了基于文本提示的世界事件功能,可动态改变模拟环境。尽管尚未全面公开,谷歌展示了滑雪和仓库场景,模拟质量与最新视频模型Veo 3相当,但持续时间更长。专家认为,此类模型或将取代某些白领岗位,是开发自主系统的突破性技术。
原文链接
加载更多

暂无内容