综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年1月,蚂蚁灵波团队开源了全新通用世界模型LingBot-World,支持长达10分钟的连续生成与实时交互。用户可通过键盘和鼠标控制视角,并用自然语言实时改变生成内容,如添加烟花或切换场景。模型在一致性、记忆力及物理规律遵循方面表现突出,能够生成高度真实的虚拟环境。相比DeepMind的Genie 3,LingBot-World不仅视觉效果相当,还具备更长时序和更强交互性。此次开源引发国内外热议,被称为具身智能领域的重大进步。结合此前开源的LingBot-Depth(机器人感知)和LingBot-VLA(决策模型),蚂蚁灵波构建了一套完整的具身智能基础设施,为行业提供标准化解决方案。项目代码、论文及相关资源已全面公开。
原文链接
1月29日,蚂蚁灵波科技发布开源世界模型LingBot-World,对标Google Genie 3,在视频质量、动态程度、长时一致性等指标上表现优异。该模型支持近10分钟无损生成,解决“长时漂移”问题,适用于具身智能、自动驾驶和游戏开发。交互性能达16 FPS,延迟控制在1秒内,用户可通过键盘或鼠标实时操控角色与视角,并通过文本触发环境变化。模型具备Zero-shot泛化能力,仅需一张照片即可生成可交互视频流,降低部署成本。训练数据采用混合采集策略,覆盖多样化场景并提取纯净画面。LingBot-World为复杂长程任务提供低成本试错空间,助力智能体场景理解与泛化能力提升。目前,模型权重及推理代码已开源,推动AGI生态共建。
原文链接
加载更多
暂无内容