RobotScope RobotScope
概念词条 重要度 5/5

数据飞轮

又称:数据飞轮 · data flywheel · 数据闭环 · 规模效应闭环

部署越多机器人→采集越多真实交互数据→模型越强→机器人更好卖的自增强闭环,被视为具身智能的核心护城河。

关键玩家 · 3 家(来自公司库)

定义

数据飞轮(data flywheel)是指「部署规模 → 数据积累 → 模型迭代 → 更强能力 → 更大部署」的自我强化闭环。在具身智能场景中,每台机器人在真实环境中完成任务时都在产生感知-动作数据,这些数据经过筛选和标注后反哺策略模型训练,使下一代模型在同类任务上更准确、更鲁棒,进而推动更大规模部署。

为什么重要

数据飞轮被广泛视为具身智能赛道最难被复制的竞争壁垒:它不依赖单一技术突破,而是靠先发部署积累的真实数据形成滚雪球效应。对投资人而言,一家公司是否具备数据飞轮逻辑,往往是判断其长期价值的核心问题——有闭环的公司随规模扩张护城河加深,没有闭环的公司只是一次性的解决方案提供商。与互联网时代的用户行为飞轮类似,但机器人数据的采集成本远高于点击行为,因此初期建立飞轮的门槛极高。

技术现状

数据飞轮的实现需要同时解决三个工程问题:① 部署端的数据回传与隐私合规(工厂场景相对受控,家庭场景难度更高);② 自动化的数据质检与标注(人工打标成本随规模线性增长,必须自动化);③ 在线学习与模型更新的稳定性(线上热更新避免引入退化)。当前多数公司的飞轮仍处于早期——部署量不足以让闭环真正「转起来」,更接近「人工密集型数据积累」而非自动飞轮。Tesla Optimus 因工厂部署规模优势被认为最接近实现真实飞轮闭环。

谁在做

Tesla Optimus 以工厂内大规模部署为飞轮起点;Physical Intelligence 以多机器人形态、多任务数据积累构建跨形态通用模型的数据基础;Lightwheel Intelligence 以数据服务切入,专注提供高质量具身数据集,是飞轮基础设施层的代表。

数据待补

各公司实际的数据回传量、飞轮成熟度等核心指标均未公开披露。当前判断多来自技术路线推断,不放未经核对的具体数字。

相关概念