概念词条重要度 4/5

3D 视觉

又称：三维视觉 · 深度相机 · 3D vision · depth camera

通过结构光、ToF 或双目立体等方式获取场景深度信息，为机器人提供三维空间感知能力，是抓取与导航的感知基础。

关键玩家 · 3 家（来自公司库）

Hesai Technology (Hesai Group)

定义

3D 视觉（three-dimensional vision）是指通过深度相机或多目系统获取场景像素级深度信息，生成点云或深度图，使机器人能感知物体三维形状、位置与姿态。主流技术路线包括结构光（structured light）、飞行时间（ToF）、双目立体视觉（stereo vision）以及 RGBD 融合。

为什么重要

机器人要「看懂」三维世界才能精准抓取与避障：2D 图像丢失了深度维度，无法直接用于规划抓取点或判断物体姿态。3D 视觉是灵巧手操作、移动底盘定位、工业分拣等几乎所有具身智能场景的感知入口，也是「视觉-语言-动作」模型（VLA）获取输入的关键传感器之一。

技术现状

结构光方案在近距精细操作（0.3–1.5 m）精度高，但受强光干扰；ToF 适合中距（0.5–5 m）、帧率高，适合动态场景；双目方案成本低但对纹理依赖度高，计算量大。工业机器人领域正在推动「近感（深度相机）+ 远感（激光雷达）」融合感知架构，以覆盖从精细操作到大范围导航的全距离需求。Orbbec（奥比中光）专注 RGBD/结构光深度相机；Hesai（禾赛科技）与 Robosense（速腾聚创）以激光雷达见长，在机器人导航侧与 3D 视觉形成互补。

谁在做

Orbbec（奥比中光）是国内深度相机的主要供应商之一，产品覆盖结构光与 ToF；Hesai、Robosense 提供激光雷达，在空间感知层与深度相机形成分工。上游芯片侧，英伟达 Isaac 平台提供 3D 感知算法框架与 GPU 推理加速，服务于整体感知管线。

数据待补

3D 视觉模组在具身智能整机中的 BOM 占比、各路线渗透率等量化数据，将在后续从行业白皮书中抽取并标注来源，当前不放未核实数字。

关键玩家 · 3 家（来自公司库）

定义

为什么重要

技术现状

谁在做

数据待补

相关概念