团队
一句话定位
- 形态:标准工业臂 + 夹爪(非人形)
- 技术路径:自研原生 foundation model,非 VLM 微调,非世界模型
- 数据策略:低成本可穿戴设备采集人类操作数据(500K+ 小时),预训练不吃机器人数据
- 团队基因:Google DeepMind 机器人基础模型(PaLM-E / RT-2 / Gemini Robotics)+ Boston Dynamics(Atlas/Spot/Stretch)
来源:Forbes 报道 (2026-04-02)
核心团队
- CEO / 联合创始人:Pete Florence — 前 Google DeepMind 高级研究科学家,PaLM-E 核心作者(被引 19,000+ 次),MIT 博士(师从 Russ Tedrake)
- 联合创始人:Andy Zeng — 前 Google DeepMind 技术负责人,PaLM-E / RT-2 / Gemini Robotics 参与,Best Paper 多篇(HRI ‘24 / CoRL ‘23 / ICRA ‘23),被引 27,490+
- 联合创始人:Andrew Barry — 前 Boston Dynamics 工程师,参与 Atlas / Spot / Stretch 开发,MIT 博士
- 团队来源:OpenAI、Boston Dynamics、Google DeepMind
来源:Boldstart Ventures 博客 (2026-04-02) — Pete Florence 个人页 — Andy Zeng 个人页
组织信号
- 研发双城:Boston(总部)+ San Francisco 办公室
- 团队规模:未公开披露(截至 2026-06)
- 关键早期员工:Evan Morikawa — 前 OpenAI 产品开发核心成员(ChatGPT/GPT-4 规模化),加入 Generalist 早期创始团队,其加入作为 Spark Capital 投资决定的关键信号(来源:Fraser/Spark Capital Entropy Substack 2025-11)
- 招聘方向:机器人 learning / 基础模型 / 系统部署(来源:官网 careers 页)
- 现有合作伙伴:Universal Robots (UR preferred model partner,GTC 2026 联合 Demo,来源:UR 新闻稿 2026-03-16)
产品
Data Hands(数据手套)
- 核心创新:自研低成本可穿戴数据采集设备,非遥操作,人在日常生活中佩戴后积累操作数据
- 数据规模:500K+ 小时真实物理交互数据(截至 2026-04),全球最大规模之一
- 数据策略:基础模型预训练阶段不吃机器人数据——全部来自人类穿戴设备采集,机器人端只做微调(1 小时/任务)
- 意义:提供 existence proof——无需大规模遥操作或仿真数据就能实现高成功率
来源:GEN-1 博客 (2026-04-02) — Forbes 报道 (2026-04-02)
GEN-0 模型(2025-11)
- 发布:2025-11-04,首个验证机器人 scaling laws 存在的通用模型
- 能力:零样本多任务学习、新环境适应、物理常识涌现
- 意义:首次证明机器人 scaling laws——每 0-shot 任务同步提升
- 限制:性能不足以商业化部署
来源:GEN-0 博客 (2025-11-04)
GEN-1 模型(2026-04)
- 发布:2026-04-02,GEN-0 的 scaling + 算法进步
- 架构:100% 自研大规模多模态模型,实时输出 action(非端到端 VLA 微调)
来源:GEN-1 博客 (2026-04-02)
GEN-1 性能指标
- 成功率:简单任务 99%+(对比之前最佳 64%)
- 速度:比 prior SOTA 快约 3×
- 数据效率:每个任务仅需约 1 小时机器人数据微调
- 鲁棒性:涌现大量恢复意外场景的即兴行为
GEN-1 六大任务独立测试数据
- 汽车零部件 Kitting:连续运行 >1 小时,含意外场景恢复(washer 掉落→重新抓取→再插入,可选双手 in-hand regrasping)
- T-shirt 折叠:连续 86 次
- 扫地机器人维修:连续 >200 次
- 积木装箱(block packing):连续 >1,800 次
- 纸箱折叠:连续 >200 次
- 手机包装:连续 >100 次
来源:The Robot Report (2026-04-06) — Ars Technica (2026-04-06) — GEN-1 博客 (2026-04-02)
技术路线
核心判断
GEN-1 是首个”非经典VLA / 非世界模型”路线的自研原生物理交互 foundation model——在团队共同发明了 PaLM-E、RT-2(VLA)、世界模型之后主动另辟蹊径,99% 参数从头训练(非 VLM 微调)。
来源:Beyond World Models & VLAs 博客 (2026-04-07)
技术栈细节
- 训练策略:
- 预训练:500K+ 小时人类穿戴设备物理交互数据,无任何机器人数据
- 微调:每任务约 1 小时机器人数据
- 无大规模遥操作或仿真数据依赖
- 结合多种技术:预训练进步 + post-training + RL + 多模态人类引导 + 推理时技术
- 系统级:GEN-1 定位为”系统”而非单纯模型权重——类似前沿 LLM 有多个系统级组件
来源:GEN-1 博客 (2026-04-02)
方法论立场
- Goal-driven > Method-driven:明确选择目标驱动而非方法驱动,不贴 VLA 或世界模型标签
- 训练 from scratch 优于 fine-tune:认为足够数据+算力下从头训练永远胜出
- 跨本体泛化:已验证在多种机器人平台上快速适配(UR7e + MiR + Vention 框架)
来源:Beyond World Models & VLAs 博客 (2026-04-07)
商业验证
GTC 2026 现场 Demo(2026-03)
- 首次公开现场 Demo:在 NVIDIA GTC 2026(Silicon Valley),Universal Robots 展台
- 平台:UR7e 臂 + MiR 底盘 + Vention 框架(移动操作平台,此前不存在)
- 准备时间:仅数天(从机器人抵达办公室 → Demo 联调)
- 零场景数据:在 GTC 展馆内首次运行表现与办公室一致——“generalization for free”
- 持续运行:展会全程不间断运行,已验证模型的弹性和泛化能力
- 任务:多步骤精确操作(纸箱组件组装,强调运动精度 + 力精度)
来源:GTC Demo 博客 (2026-03-24)
交叉操作涌现案例(2026-04)
- 首个’jaw on the floor’时刻:Andy Barry 描述——机器人被训练用左手拾取并摇晃塑封袋,但一次 rollout 中主动用右手完成操作,团队反复确认从未教过右手的动作
- 核心意义:证明 GEN-1 base model 具备跨 hand 泛化的涌现能力,远超出训练分布
来源:Automate.org 专访 (2026-04-16) — Brian Heater 专访 Andy Barry
商业化信号
- GEN-1 在某些任务上首次超过”商业化可用”性能门槛
- 早期合作伙伴:Early access partners 已可接入 GEN-1([email protected])
- 合作伙伴行业:未公开披露(截至 2026-06-03)
- 尚未公布付费客户或具体部署合同(截至 2026-06-03)
竞争定位
- 核心壁垒:500K+ 小时人类物理交互数据 + 自研原生(非 VLM 微调)模型架构 + PaLM-E/RT-2/Gemini Robotics 三核心团队
- 差异化:
- vs Physical Intelligence(π0/π0.7):不同硬件哲学(标准臂 vs 多形态泛化),不同数据路线(可穿戴 vs 遥操作)
- vs Skild AI:Skild 强调仿真+真实混合 + 多本体覆盖,Generalist 押注纯人类可穿戴数据
- vs 传统 VLA 路线(如 RT-2):主动超越,99% 参数从头训练
- 已验证:NVIDIA + Bezos Expeditions 作为种子轮投资者背书
风险
商业化执行风险
- 付费客户缺失:尚无公开付费客户或收入数据(截至 2026-06-03)
- 早期合作伙伴进展:Early access 开放中,但具体部署合同未公开
- 估值 $440M / $140M 种子轮:无收入情况下估值/融资比极高,需加速商业化以避免估值回调
技术路线风险
- 数据可穿戴路线验证不足:500K+ 小时人类穿戴数据能否扩展到工业级复杂场景(如精密装配、高负荷焊接)未验证
- 非人形路线局限:标准工业臂+夹爪方案在需要移动性/复杂空间覆盖的场景中受限(vs 人形/轮式全向方案)
- 99% 成功率基础:当前测试集中于简单任务(折叠/组装/包装),复杂长程任务(multi-step reasoning over hours)仍未覆盖
竞争风险
- 赛道拥挤:PI(π0.7)、Skild AI、Rhoda AI、Field AI 等均争夺机器人大脑/基础模型层,资金竞争激烈
- NVIDIA 中性化:NVIDIA 同时投资 Generalist(种子轮)和多家竞争公司(GR00T N1.5 开源模型直接竞对),背书不独占
来源:综合判断依据现有 sources(Ars Technica, Forbes, GEN-1 博客, Robot Report, Automate.org)
动态记录
- 2026-04-16:【深度报道】Automate.org 发布 Brian Heater 专访 Andy Barry,披露首个交叉操作涌现案例(左手训练→右手自主完成)、团队迭代节奏(5个月 GEN-0→GEN-1)、Data Hands 硬件细节。来源:Automate.org
- 2026-04-02:【产品发布】Forbes 报道 GEN-1 模型发布,首次实现简单任务 99%+ 成功率、3× 速度提升、仅需 1 小时机器人数据微调。500K+ 小时数据集。来源:Forbes + GEN-1 博客
- 2026-03-24:【Demo】NVIDIA GTC 2026 首次公开现场 Demo,与 Universal Robots 合作 UR7e + MiR 移动操作平台,仅数天准备、零场景数据、全程连续运行。来源:GTC Demo 博客
- 2026-01-29:【技术进步】发布《The Dark Matter of Robotics: Physical Commonsense》博客,展示 GEN-0 物理常识涌现能力。来源:Generalist AI 博客
- 2025-11-04:【产品发布】GEN-0 模型发布,首次验证机器人 scaling laws,零样本多任务同步提升。来源:GEN-0 博客
- 2025-06:【融资】$140M 种子轮,Boldstart Ventures 和 NVIDIA 联合领投,Spark Capital、NFDG、Bezos Expeditions 参投。来源:Boldstart Ventures 博客
- 2024-03:【创立】Boldstart Ventures inception round 投资,MIT PhD 后筹备期。