智元机器人,把中国机器人打造成全球的一张技术名片

智元机器人这次联手清华大学和麦吉尔大学,在中国给具身智能走进现实环境铺了一条路,他们弄了一个叫MANSION的东西。这个MANSION挺牛的,已经入选了CVPR2026,算是学术界给它的一个肯定。他们用这个MANSION做了个全球首个针对整栋建筑的语言驱动3D场景生成框架,不光能弄大规模场景,还帮了大忙,让那些在医院搬东西、写字楼配送、家里干活的机器人真的能跨楼层干活。现在的机器人感知操作导航能力都上去了,但是练手的地方还在老样子——“单层样板间”,跟真实世界差距大得很。真实的扫描数据贵又不好改;现有的虚拟环境大多是单层的,没有楼梯电梯这些关键结构。要想训练跨楼层的复杂任务可太难了。 所以团队就推出了这个MANSION混合框架,把多模态大模型和几何求解器给结合起来了。跟以前那种简单房间拼接不一样,MANSION从大局出发:先把楼的功能分区、交通和风格给规划好,再一层层地搞拓扑结构和房间布局。它通过几何求解来保证平面图符合物理规则,最后生成的3D场景直接就能在仿真器里跑。这下楼梯电梯啥的就都对齐了。 基于这个框架,他们还弄了个MansionWorld数据集:有1000栋多层的楼,2到10层不等,房间数超过一万个。不管是住家还是办公室、医院、学校、商场都有覆盖。而且这数据集还能直接导到Blender和NVIDIAIsaacSim这些平台上用。大家都知道CVPR是计算机视觉里顶呱呱的会议,MANSION能被选上,说明学术界觉得它挺有创新和价值的。 从一层变多层、从死板变灵活、从假的场景变真的任务世界,这可是大突破。智元机器人说以后还会继续深耕技术,把MansionWorld数据集和生态能力开放出来。他们想跟全球的合作伙伴一起努力,让机器人真正走进楼宇、家庭和商场这些复杂的地方。他们想用持续创新的实力把中国机器人打造成全球的一张技术名片。