标题:1段视频=亿万虚拟场景!群核开源空间理解多模态模型,真实世界秒变机器人训练场
GTC2025全球大会上,群核科技宣布开源空间理解模型SpatialLM。这是一个基于大语言模型的3D场景语义生成框架,突破了传统大语言模型对物理世界几何与空间关系的理解局限,赋予机器类似人类的空间认知和解析能力。SpatialLM为具身智能领域提供了一个基础的空间理解训练框架,企业可通过微调降低具身智能训练门槛。仅需一段视频,该模型即可生成物理正确的3D场景布局,基于点云数据准确理解结构化场景信息。SpatialLM已在HuggingFace、GitHub、魔搭社区等平台开源,并将持续迭代自然语言和场景交互功能。
相比Meta的SceneScript模型,SpatialLM的独特之处在于:一是兼容普通相机和手机视频输入,更具通用性;二是输出3D场景的自然语言描述,支持原生自然语言与场景数据交互;三是支持对物理空间信息的认知理解和结构化描述。群核科技利用自身积累的海量三维数据和空间认知数据,使模型具备创建物理正确空间场景的能力。
群核科技董事长黄晓煌表示,SpatialLM旨在帮助具身智能机器人完成空间认知理解的基础训练,而SpatialVerse则通过合成数据方案为机器人搭建接近物理真实的“数字道场”。两者协同打通“现实-虚拟-现实”闭环,将现实世界转化为虚拟环境中的丰富场景。黄晓煌认为,具身智能机器人的爆发性发展需要全行业的共同努力,群核科技希望通过开源推动技术进步,目前已与多家国内外企业达成合作。
原文链接
本文链接:https://kx.umi6.com/article/15731.html
转载请注明文章出处
相关推荐
.png)
换一换
深眸科技获数千万元Pre-A轮融资,大型复合机器人赋能工业生产
2025-04-30 19:09:39
很多投资人心里都住着一个「朱啸虎」
2025-04-03 16:26:50
首个具身智能创新产业园落户北京海淀
2025-03-30 19:50:27
清华大学唯一持股具身智能企业“星动纪元”完成近 5 亿元 A 轮融资
2025-07-07 13:29:57
自变量机器人:统一框架下的具身多模态推理
2025-06-20 21:06:19
初期年产1000台,投资超2亿!智元机器人、均普智能等成立合资公司及创新中心
2025-04-08 01:25:07
硅基进化,万物共生| 联想创投2025 CVC创投周
2025-07-22 21:39:04
面对具身智能热潮,泼冷水不见得是坏事
2025-04-21 16:46:35
具身智能创业来了位浙大博导,机器人会飞,VC抢着投
2025-06-23 20:34:36
特斯拉、英伟达机器人背后的“卖水人”
2025-07-06 07:09:53
80 TOPS算力、大小脑超级异构!地瓜机器人RDK S100开启预售,限时优惠价2499元
2025-06-11 15:11:42
针对具身智能,华为哈勃首次出手
2025-05-08 21:37:50
2025 上半年具身智能融资复盘:金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多
2025-07-17 18:29:16
404 文章
54012 浏览
24小时热文
更多

-
2025-07-22 21:40:00
-
2025-07-22 21:39:04
-
2025-07-22 19:38:40