RobotScope RobotScope

Rhoda AI

US · 智能层 → 具身基础模型
估值
$1.7B
Pulse2 / BusinessWire 20
累计融资
$450M
Series A 2026-03 closed
成立
2024
US
投资方
10
已披露
速览 · TL;DR
  • US · 成立 2024 · Series A
  • 最近融资 2026-03
  • 投资方:Capricorn Investment Group、Khosla Ventures、Leitmotif、Matter Venture Partners、Mayfield 等
  • 定位:智能层 · 具身基础模型(foundation-model、video-predictive、DVA、FutureVision)
foundation-model video-predictive DVA FutureVision
最后更新
◇ 十问画像 · 投资人 / 创业者视角
目标场景 / ROI
主攻高变异性制造与物流场景,商业模式是向硬件/软件合作伙伴授权 FutureVision 智能层;官方称在生产制造环境中做到小于 2 分钟/周期、达到或超过客户性能目标,但付费部署、回本周期、营收均未披露。
产品形态 / 泛化
无自研整机,定位为 Foundation Model / Intelligence Layer 提供方;宣称可覆盖制造、物流、汽车、电商等场景,并展示 one-shot 人类演示跟随,但泛化边界未独立验证。
技术路径
路线是 Direct Video-Action(DVA),以因果视频生成作为策略中间表示,再由 inverse dynamics 翻译为动作;核心是互联网视频预训练 + 少量机器人数据后训练,未披露自研通用基座模型之外的外部模型依赖。
数据策略
数据来源是数亿互联网视频预训练,加上约 10–20 小时机器人数据后训练;公司自己也承认无自营整机,数据获取依赖合作伙伴部署,飞轮存在启动偏慢风险。
硬件 / 成本
不做自营整机、以 license 模式接入伙伴硬件;关键自研部件、单机成本、BOM、供应链依赖均未披露。
落地阶段
2026-03 才出 stealth,现阶段有生产环境评估和多个客户 PoC,公开 demo 显示 Decanting 连续自主运行 1.5 小时、Contico Breakdown 160 分钟;真实部署台数未披露。
团队基因
创始/核心团队偏 deep-tech 创业 + 计算机视觉/生成模型 + 机器人学术背景:Jagdeep Singh 来自 QuantumScape/Infinera,Gordon Wetzstein 为 Stanford 视觉教授,Eric Ryan Chan 来自 World Labs。
估值水分
2026-03 Series A 融资 $450M、估值 $1.7B;但客户数量、合作伙伴名单、收入规模均未公开,估值显著跑在业务披露前面。

围绕投资人 / 创业者关注的核心问题整理,只用公开档案事实、未披露处明确标注。

◈ 一屏投资判断卡 · 投资人速览
商业化阶段
pilot;依据是 2026-03 才出 stealth,已披露生产环境评估和多个客户 PoC,但未披露量产或大规模交付。
部署证据
有真实场景证据但不够穿透,官方称制造现场小于 2 分钟/周期且无人工干预,并公开 1.5 小时/160 分钟连续运行视频,但客户名和部署台数未披露。
收入透明度
很差;收入规模、付费客户数、合同金额、复购情况均未披露。
融资压力
2026-03 刚完成 $450M(约 4.5 亿美元)Series A,短期资金弹药充足,但烧钱节奏与现金消耗未披露。
技术护城河
主要在“互联网视频预训练 + 少量机器人数据后训练”的 DVA 路线,属于模型/数据方法壁垒,但目前大多仍是公司自报。
供应链风险
公司不做整机而是授权给伙伴,关键风险不是自家零部件,而是对合作伙伴硬件与部署能力的依赖;关键部件自研范围未披露。
估值合理性
偏贵;因为 $1.7B 估值已被官方 PR 坐实,但公开业务仍无收入、无客户名单、无部署规模。
下一里程碑
该盯的不是再发技术博客,而是公开具名合作伙伴/客户、付费部署与独立 benchmark,对当前估值支撑更关键。
⊟ 自报 vs 已验证 vs 仍未知
📣 公司宣称
  • ·数亿互联网视频可作为预训练主数据源
  • ·后训练仅需约 10–20 小时机器人数据
  • ·Shell Game 成功率 96%
  • ·生产制造环境中可做到小于 2 分钟/周期且达到或超过客户目标
✓ 已验证
  • ·2026-03 完成 Series A 融资 $450M、估值 $1.7B,BusinessWire 官方 PR 与多家媒体有一致记录
  • ·官方网站与官方 YouTube 已公开 Bearing Decanting 1.5 小时、Contico Breakdown 160 分钟长视频
  • ·官方团队页可核实核心团队与约 60 人团队规模
? 仍未知
  • ·收入规模与是否已有稳定付费客户
  • ·合作伙伴名单与真实部署台数
  • ·单机/单任务成本结构
  • ·故障率、人工干预率、复购与续约情况
⚖︎ RobotScope 判断 · 观点(非事实) 置信度:中 截至 2026-05-22

Rhoda 押注的技术差异化在概念上最有趣:用互联网视频预训练替代大量遥操作数据采集,降低新任务学习门槛,Shell Game 96% 成功率是可验证的公开 demo。但赌注也在这里——video-predictive 路线在非结构化真实工业环境里的泛化能力是否比 VLA(PI/Skild)路线更强,目前只有自家 PR,没有独立基准对比。$1.7B 估值对于一个刚出 stealth、零收入、零合作伙伴公开披露的公司,是典型的「技术溢价 + 创始人光环」定价;Jagdeep Singh 的 QuantumScape 经历证明了 deep-tech 执行力,但也证明了从 demo 到量产的漫长周期。

产业链定位:美国具身基础模型公司,2024 年成立,18 个月 stealth 后 2026-03 出山;Series A $450M,$1.7B 估值(BusinessWire 官方 PR 坐实);核心技术路线 DVA(Direct Video Action)——以生成未来视频帧为策略中间表示,后训练仅需约 10 小时遥操作数据;目标场景:高变异性制造与物流,商业化模式为向硬件合作伙伴 license。

强项
  • +DVA 技术路线差异化真实:以未来视频生成为策略中介,数据效率高(~10h 后训练),技术逻辑自洽且有公开 demo 佐证
  • +$450M Series A 投资人阵容顶级(Khosla/Temasek/Mayfield/John Doerr),资本信号强,融资数字已由官方 PR 坐实
  • +Jagdeep Singh 连续 deep-tech 创业记录(Infinera/Raxium/QuantumScape),具备从 0 到资本市场的完整执行经验
软肋 / 风险
  • 商业化极早期:2026-03 才出 stealth,无公开客户、无合作伙伴名单、无收入信号,production demo 描述来自自家 PR
  • video-predictive 路线与 VLA(PI 的 π0、Skild)的真实性能对比缺乏独立基准,技术优越性尚未被第三方验证
  • license 模式依赖合作伙伴硬件成熟度,若整机公司选择自研智能层(如宇树、Figure),Rhoda 的市场空间将受压缩

判断依据:融资金额和估值来自 BusinessWire 官方 PR(高可信);DVA 技术细节来自官方 PR 和 LinkedIn 官方帖(自述为主);独立媒体(Automate.org/Pulse2)报道为二手转述;因商业化数据缺失,置信度中。

Talos · RobotScope 编辑判断 · 以上为基于公开来源与数据的编辑判断,非客观事实,可能有误;指正请见页底反馈。

RobotScope 投研评分

2.9 / 5 观点层 · 基于事实的判断 · 2026-05-25

Rhoda 是一笔押 video-native 智能层路线的高价早期赌注:技术叙事足够锋利,但经营证据还停在 PoC 和官方 demo。

商业化 2026-03 才出 stealth,披露为生产环境评估和多个客户 PoC;客户名单、收入、部署台数未披露。
技术壁垒 DVA/video-predictive control 路线差异化明确,Research Blog 披露因果视频模型、inverse dynamics、Leapfrog Inference。
数据壁垒 公司自报数亿互联网视频预训练与 10–20 小时机器人数据后训练,但无自营整机,数据飞轮依赖合作伙伴,且缺第三方验证。
硬件能力 公司定位 intelligence layer,不自研整机;关键自研部件、BOM、硬件成本均未披露。
融资健康 2026-03 完成 $450M Series A,投资方阵容强,短期资金弹药充足;烧钱节奏未披露。
供应链 不做整机可降低自有供应链暴露,但落地依赖合作伙伴硬件成熟度;关键依赖未披露,数据不足。
团队 核心团队覆盖 deep-tech 连续创业、计算机视觉/成像、生成模型与机器人学术资源,官方团队页约 60 人。
估值合理性 $1.7B 估值已披露,但公开业务仍无收入、客户名单和部署规模,估值明显先于经营验证。
透明度 融资、团队和技术叙事披露较多,但收入、付费客户、合同、故障率、人工干预率均未披露。
风险可控 技术性能多为公司自报,license 模式受合作伙伴硬件与部署意愿约束,商业化与数据飞轮风险仍高。
看多
DVA 用互联网视频预训练降低机器人数据需求,官方披露 10–20 小时后训练、长上下文闭环控制和多个工业 demo;团队与融资能力也足以支撑长周期研发。
看空
$1.7B 估值前面没有公开收入、客户名单、部署台数和独立 benchmark,license 模式还把数据飞轮和落地节奏交给合作伙伴。
最关键未验证假设
DVA 在具名客户真实生产线里的故障率、人工干预率、单位经济性和复购是否能支撑 $1.7B 估值。
下次看点
公开具名合作伙伴/付费客户、部署台数、独立 benchmark,以及从 PoC 转为可复制生产部署的证据。

评分为 RobotScope 基于公开事实的判断(观点层),非投资建议;事实层见下方「关键事实 · 证据分级」。

关键事实 · 证据分级

每条关键事实标注证据等级、是否第三方验证、来源与最后校验日 · 本页最近校验 2026-05-25

等级:A 官方/IPO 文件 · B 一线媒体 · C 官网/官方 PR · D 二手/盘点 · E 传闻/未确认
关键事实 等级 状态 来源 校验日
最近融资融资金额在档案中同时由官方 PR 与媒体报道记录。 2026-03 Series A,$450M B 已验证 2026-05-25
最新估值估值为档案披露值,非估算。 2026-03 post-money $1.7B B 已验证 2026-05-25
投资方 Capricorn Investment Group, Khosla Ventures, Leitmotif, Matter Venture Partners, Mayfield, Premji Invest, Prelude Ventures, Temasek, Xora, John Doerr B 已验证 2026-05-25
2025营收 未披露 未披露 2026-05-25
产品阶段 2026-03 发布 FutureVision;18 个月 stealth 后出山,现阶段为生产环境评估和多个客户 PoC B 已验证 2026-05-25
部署证据性能与客户目标口径来自公司/PR转述,未见第三方客户证言。 生产制造环境评估;官方称小于 2 分钟/周期、无人工干预、达到或超过客户性能目标;客户名和部署台数未披露 B 公司自报 2026-05-25
核心技术路线 Direct Video-Action(DVA):因果视频生成模型预测未来视频,再由 inverse dynamics 翻译为动作 C 公司自报 2026-05-25
数据策略数据规模与数据效率为公司自报,未见第三方 benchmark。 数亿互联网视频预训练 + 约 10–20 小时机器人数据后训练 C 公司自报 2026-05-25
Demo 性能官方 demo/视频可见,但成功率、无人干预率等未见独立复测。 Shell Game 96% 成功率;Bearing Decanting 连续自主运行 1.5 小时;Contico Breakdown 连续自主运行 160 分钟 C 公司自报 2026-05-25
团队 Jagdeep Singh、Eric Ryan Chan、Gordon Wetzstein、Andrew Wooten、Changan Chen 等核心团队;团队页约 60 人 C 已验证 2026-05-25

反 YY:公司自报 / 未验证项已显式标注;"未披露"项如实留白,不臆造。

关键时刻

融资 / 估值 / 收购等里程碑事件

  1. 估值 $1.7B

    Pulse2 / BusinessWire 2026-03 Series A at $1.7B post-money

  2. 累计融资 $450M

    Series A 2026-03 closed $450M, Pulse2 press coverage

  3. 公司成立

    US

2026-03:估值 $1.7B — Pulse2 / BusinessWire 2026-03 Series A at $1.7B post-money;2026-03:累计融资 $450M — Series A 2026-03 closed $450M, Pulse2 press coverage;2024:公司成立 — US

投资方阵营

Capricorn Investment GroupKhosla VenturesLeitmotifMatter Venture PartnersMayfieldPremji InvestPrelude VenturesTemasekXoraJohn Doerr

变更记录

本档案的更新与关键事实变化 · 长期维护 · 最近更新 2026-05-25

  • 2026-05-25 上线证据分级 + 投研评分 + 标准化档案。
  • 2026-05-24 官方 Research Blog 披露 DVA 技术细节、10–20 小时后训练数据口径,以及 Decanting 1.5 小时和 Contico 160 分钟连续运行 demo。
  • 2026-05-24 官方团队页确认核心领导层和约 60 人团队规模。
  • 2026-03-10 Rhoda AI 18 个月 stealth 后发布 FutureVision 平台,并宣布 $450M Series A、$1.7B post-money 估值。
  • 2024 公司成立。

发现数据有误或过期?指正 →

📄 完整档案 — 团队 · 产品 · 技术 · 动态记录等

一句话定位

  • 形态:无自研整机——提供 Foundation Model / Intelligence Layer,license 给硬件/软件合作伙伴
  • 技术路径:Direct Video-Action (DVA) — video-predictive control,互联网视频预训练 + 闭环视频预测反推动作
  • 数据策略:互联网级视频预训练(数亿视频)→ 少量机器人遥操数据后训练(~10 小时/任务)
  • 团队基因:连续 deep-tech 创业者 Jagdeep Singh(QuantumScape/Infinera)+ Stanford 计算机视觉教授 + World Labs 前生成模型架构师

来源:Pulse2 (2026-03-10) + Rhoda AI Research Blog (2026-05-24)

团队

核心领导层(2026-05-24 官方团队页确认)

  • 首席执行官 / 联合创始人:Jagdeep Singh,此前任 QuantumScape (NYSE: QS) CEO 10+ 年(1→NYSE 上市),更早创立 Infinera (NASDAQ: INFN)、Lightera(被 Ciena 收购)、Raxium(被 Google 收购);MS CS Stanford + MBA UC Berkeley
  • 首席科学家 / 联合创始人:Eric Ryan Chan,此前任 World Labs 生成模型架构师
  • 科学顾问 / 联合创始人:Gordon Wetzstein,Stanford 教授,Computational Imaging Lab,计算机视觉与成像系统
  • 首席产品官 / 联合创始人:Andrew Wooten
  • 首席研究官 / 联合创始人:Changan Chen
  • 首席战略官:Steve Tirado
  • 首席数据官 / VP 软件工程:Alex Bergman(兼任)
  • 技术贡献者:Siddhartha Srinivasa(机器人领域知名学者,UW 教授/前 Amazon Robotics)

来源:Rhoda AI Team Page (2026-05-24) — 🟢 官方一手

组织信号

  • 团队规模:~60 人(团队页罗列 60 人,含 CEO/Scientist/部分工程团队)
  • 多学科构成:Generative AI、Computer Vision、Robotics
  • Joanne Truong 在榜(此前 1X Technologies 感知团队)

来源:Rhoda AI Team Page (2026-05-24) — 🟢 官方一手

产品

FutureVision 平台

  • 发布时间:2026-03-10(18 个月 stealth 后)
  • 定位:Robotic Intelligence 平台 / Foundation Model,核心 intelligence layer
  • 商业模式:license 给不同硬件和软件合作伙伴(非自营整机)
  • 初始部署场景:制造与物流(高变异性工业环境)

来源:Pulse2 (2026-03-10) — 🟡 中可信

部署场景(官方网站 Demo)

  • Returns Processing(退货处理):端到端物流退货流程,长上下文记忆解决视觉歧义(类似进度看起来相近的阶段需要区分)
  • Bearing Decanting(轴承分装):汽车装配线,每箱 10 kg,开箱→分装→分类包装,需双手操作 + 处理薄塑料袋/绑带等易损件。客户此前认为不可自动化
  • Contico Breakdown(重型容器拆解)50 磅 Contico 箱,去渣→开锁→折叠回收。因容器大导致的动作不精确放大 + 碎屑随机性
  • Human Demo Following(人类演示跟随):单次人类演示注入上下文窗口 → 零样本执行 pick & place 和 drawing

来源:Rhoda AI Official Site (2026-05-24) — 🟢 官方一手

技术路线

核心判断

video-predictive control(DVA):不依赖机器人遥操数据为主源,而是用互联网规模视频预训练(数百 million 视频)学习运动/物理先验,再用少量机器人数据后训练(~10 小时),最终实现闭环视频预测 → 反推动作。

DVA(Direct Video-Action Model)架构

  • 架构本质:机器人策略即因果视频生成模型,视频模型直接指定目标行为 → inverse dynamics 模型翻译为可行动作
  • 上下文:原生支持数百帧视觉上下文(非 typical VLA 的几帧)
  • 闭环频率:每几百毫秒循环一次(连续感知-预测-执行)
  • 3 项关键技术

① Causal Video Model + Context Amortization

  • 预训练方式:从零训练因果视频模型(非从双向模型蒸馏),因果视频生成目标
  • Context Amortization:训练时在历史无噪声上下文的每个位置同时预测未来帧(类比语言模型的 next-token prediction),高效利用数百帧上下文
  • 推理:KV-caching 重用已编码上下文,避免冗余计算
  • 与竞品区别:此前 causal video 方法编码全输入序列但仅监督少量预测帧,计算昂贵;Force22 使用随机噪声掩码但推理退化

来源:Rhoda AI Research Blog (2026-05-24) — 🟢 官方一手

② Inverse Dynamics Model(反推动作翻译)

  • 核心逻辑:视频生成已处理策略决策 → 反推动作翻译是受限得多的非因果预测问题
  • 数据需求:仅需 ~10 小时同构型机器人数据(甚至随机 motion 即可)
  • 同构型复用:同型机器人上跨任务通用

来源:Rhoda AI Research Blog (2026-05-24) — 🟢 官方一手

③ Leapfrog Inference(跳步推理)

  • 问题:模型推理耗时长,物理世界不等模型
  • 方案:重叠推理与动作执行。每帧预测足够长的未来覆盖下一次推理延迟。当前推理时机器人执行上次预测的动作
  • 连续性保障:每次预测以上次执行的动作做条件输入,避免 frame-to-frame 抖动

来源:Rhoda AI Research Blog (2026-05-24) — 🟢 官方一手

数据效率指标

  • 后训练数据量:10–20 小时机器人数据(几日内完成采集)
  • Shell Game Demo96% 成功率(三杯猜球,需持续跟踪对象位置/状态/交换)
  • 长达无干预运行

来源:Research Blog (2026-05-24) — 🟢 + LinkedIn Demo (2026-05-22)

路线特征总结

  • 强视频先验:互联网视频预训 → 自然理解物理交互/运动/3D 结构/行为惯例
  • 闭环部署:非 open-loop,连续感知-预测-执行
  • 解释性:通过自回归视频生成可视化决策过程,可检查模型决策、比较配置、验证安全行为
  • 路线对标题:physical AI 的”video-native”路线,区别于以语言/图像为中介的传统 VLA

One-Shot 学习能力

  • 上下文学习:注入人类演示视频到上下文窗口 → 零样本执行 pick & place / drawing(无需权重更新)
  • 与业界路线对比:VLA(Vision-Language-Action)以语言/图像为中间表示 → 动作;DVA 以生成未来视频帧为中间表示 → 反推动作

来源:Research Blog (2026-05-24) — 🟢 官方一手

商业验证

  • 阶段:极早期——2026-03 才出 stealth
  • 已展示
    • 生产制造环境中完成评估:高容量生产线中,机器人小于 2 分钟/周期完成零部件处理,无人工干预,达到/超过客户性能目标
    • 多个客户 PoC 成功运行数小时无干预(Decanting 1.5h / Contico 160min)
  • 客户垂直领域:汽车、制造、物流、电商(官网声明)
  • 不确定性:客户数量、收入规模、合作伙伴名单均未公开

来源:Pulse2 (2026-03-10) — 🟡 + Rhoda AI Site (2026-05-24)

融资历史

轮次金额时间投资方
Series A$450M2026-03Capricorn Investment Group, Khosla Ventures, Leitmotif, Matter Venture Partners, Mayfield, Premji Invest, Prelude Ventures, Temasek, Xora, John Doerr
  • 估值:$1.7B post-money
  • 投资人评论:Leitmotif 合伙人 Jens Wiese(前 VW 集团高管)称”自动化高变异性任务在传统上抗拒自动化,Rhoda 的方法可大幅扩展可自动化的范围”

来源:Pulse2 (2026-03-10) — 🟡 中可信

竞争定位

核心判断

  • 赛道:具身基础模型 / 智能层(与 Physical Intelligence、Skild AI、Covariant 直接对位)
  • 差异化路线:video-predictive control(DVA),视频生成作为策略的中介表示
  • 与 1X World Model 对比:1X 也用视频生成但 home-first 整机路线;Rhoda license model + 工业场景
  • 数据飞轮风险:无自营整机 → 数据获取依赖合作伙伴部署 → 飞轮启动更慢
  • 主要挑战:stealth 刚出仅有 PoC;PI 的 π0.7、Skild 的通用模型已有公开 benchmark

风险

  • 商业化风险:license 模式依赖合作伙伴硬件成熟度与部署意愿
  • 执行风险:Jagdeep Singh 有成功创业记录但 robotics 领域经验存疑(团队含世界级人才部分对冲)
  • 估值:$1.7B 已有显著溢价,但收入信号为零
  • 数据飞轮风险:无自营整机部署 → 机器人数据获取受限于合作方进度
  • 竞争收紧:video 路线+工业场景正在拥挤——1X World Model、NVIDIA Cosmos、Google Gemini Robotics 等均在类似方向

动态记录

  • 2026-05-24:深度更新(Phase 2 升级)。从官方 Research Blog 获取完整技术细节(因果视频模型·Context Amortization·Leapfrog Inference),确认两个工业 PoC 的量化数据(1.5h / 160min 无干预运行),更新团队全景(60 人,含 Eric Chan/Gordon Wetzstein/Siddhartha Srinivasa)。已知 YouTube 长视频链接:DecantingContico。来源:Research Blog (2026-05-24)、Team Page (2026-05-24)。
  • 2026-05-22:首次建档。sources 基础条数 4 条。
  • 2026-03-10:[重大事件] Rhoda AI 出 stealth。发布 FutureVision 平台 + 宣布 $450M Series A at $1.7B valuation。来源:BusinessWire/Pulse2 (2026-03-10)。
持续追Rhoda AI 和这个赛道?

订阅 RobotScope:估值 / 融资 / 技术拆解 + 一周大事件,上线即送邮箱,不灌水。

数据来源 · Provenance 共 14 条 · 🟢 9 · 🟡 5
展开其余 6 条来源

🟢 一手/官方 · 🟡 媒体 · 🔴 二手

数据有误?

点这里告诉我们

不构成投资建议

← 返回公司库