RobotScope RobotScope
概念词条 重要度 4/5

数据采集(遥操作与动作捕捉)

又称:数据采集 · 动作捕捉 · 遥操数采 · data collection · motion capture · teleoperation data

通过遥操作或动作捕捉设备采集人类示范数据,是当前具身智能训练数据的主要来源,直接决定策略模型的上限。

关键玩家 · 4 家(来自公司库)

定义

数据采集(data collection)在具身智能语境下特指采集人类示范的机器人动作数据,主要手段有两类:① 遥操作(teleoperation)——操作员通过手柄、数据手套或主从臂远程控制机器人完成任务,同步记录机器人的感知与动作序列;② 动作捕捉(motion capture)——用光学标记点或穿戴式惯性传感器记录人体动作后再映射到机器人。两者都旨在把人类的灵巧操作转化为可训练的监督信号。

为什么重要

当前主流策略模型(VLA、扩散策略等)以模仿学习为基础,训练质量几乎直接取决于示范数据的数量与多样性。不同于语言/视觉领域可大规模爬取互联网数据,机器人动作数据必须专门采集,成本高、规模化难,是全行业的共同瓶颈。谁能高效低成本地积累真实操作数据,谁就在模型训练上拥有难以复制的竞争优势。

技术现状

遥操作是当前最普遍的采集方式,设备路线分化:专用主从臂(高保真、高成本)、数据手套(灵活、延迟较低)、VR 手柄(成本低、精度受限)。动作捕捉则多用于采集全身运动数据,双足行走与全身协调任务依赖度更高。仿真数据生成(见世界模型)被视为补充或替代真实采集的长期方向,但 sim-to-real 差距尚未消除,短期内真实遥操数据仍不可替代。多家公司正在研发降低采集门槛的工具——如更直觉的操控界面、自动化质检流程——以提升单位时间的有效数据产出。

谁在做

Physical Intelligence(π0 训练依赖大规模遥操)、Sunday Robotics(数据手套采集方案)、Unitree(结合全身动捕采集双足数据)等为代表。Tesla Optimus 以工厂内规模化人工示范作为数据飞轮起点。各家采集规模与质检标准的细节多未公开披露。

数据待补

各公司遥操作小时数、数据集规模等量化指标高度保密,暂只放已核实的技术路线与公开事件,不放未经核对的数字。

相关概念