3D 视觉
通过结构光、ToF 或双目立体等方式获取场景深度信息,为机器人提供三维空间感知能力,是抓取与导航的感知基础。
关键玩家 · 3 家(来自公司库)
定义
3D 视觉(three-dimensional vision)是指通过深度相机或多目系统获取场景像素级深度信息,生成点云或深度图,使机器人能感知物体三维形状、位置与姿态。主流技术路线包括结构光(structured light)、飞行时间(ToF)、双目立体视觉(stereo vision)以及 RGBD 融合。
为什么重要
机器人要「看懂」三维世界才能精准抓取与避障:2D 图像丢失了深度维度,无法直接用于规划抓取点或判断物体姿态。3D 视觉是灵巧手操作、移动底盘定位、工业分拣等几乎所有具身智能场景的感知入口,也是「视觉-语言-动作」模型(VLA)获取输入的关键传感器之一。
技术现状
结构光方案在近距精细操作(0.3–1.5 m)精度高,但受强光干扰;ToF 适合中距(0.5–5 m)、帧率高,适合动态场景;双目方案成本低但对纹理依赖度高,计算量大。工业机器人领域正在推动「近感(深度相机)+ 远感(激光雷达)」融合感知架构,以覆盖从精细操作到大范围导航的全距离需求。Orbbec(奥比中光)专注 RGBD/结构光深度相机;Hesai(禾赛科技)与 Robosense(速腾聚创)以激光雷达见长,在机器人导航侧与 3D 视觉形成互补。
谁在做
Orbbec(奥比中光)是国内深度相机的主要供应商之一,产品覆盖结构光与 ToF;Hesai、Robosense 提供激光雷达,在空间感知层与深度相机形成分工。上游芯片侧,英伟达 Isaac 平台提供 3D 感知算法框架与 GPU 推理加速,服务于整体感知管线。
数据待补
3D 视觉模组在具身智能整机中的 BOM 占比、各路线渗透率等量化数据,将在后续从行业白皮书中抽取并标注来源,当前不放未核实数字。