一句话定位
- 形态:具身世界模型(智能层,软硬一体方案)
- 技术路径:原生3D动态世界模型(V-4D-A架构),与行业主流的2D VLA/像素生成派/3D重建派形成第三条路线
- 数据策略:自研”影身360”数据采集系统(4-5个百元级RGB摄像头实现实时3D重建),Real2Real数据生成范式,训练效率为视频数据的20倍
- 团队基因:清华博士CEO(前阿里本地生活机器人负责人)+ 清华教授科学家天团(刘烨斌杰青+孟子阳万人计划)
- 商业进展:入选柔性智造(制鞋涂胶)场景,8h生产3000双鞋,千万级订单,2025年目标交付上百台
来源:甲子光年深度报道 (2026-04-20)
团队
创始人CEO
- 闵伟:清华大学工学博士,前阿里巴巴机器人团队技术负责人,20+年AI和机器人研发经验
- 从0到1:主导阿里本地生活配送机器人的全链路研发与商业化(楼宇、医院、酒店场景)
- 创业动机:认为VLA模型用人类自然语言限制机器人,提出”视频语言化”替代方案
联合科学家团队
- 刘烨斌:清华大学自动化系、脑与认知科学研究所教授,杰出青年科学家(杰青),长期致力动态三维重建理论和关键技术创新
- 孟子阳:万人计划领军人才,深耕机器人运控、定位与导航系统
核心团队背景
- CTO / COO / 副总裁:来自阿里巴巴、吉利、美团、京东、顺丰等企业的核心业务部门,覆盖算法研发、硬件量产、供应链管理及行业客户拓展
来源:甲子光年 (2026-04-20) + 投资界 (2026-04-20) + 36氪埋种轮 (2025-04-16)
产品
产品矩阵概览
- 数据系统:“影身360”实时3D数据采集系统——仅需4-5个百元级RGB摄像头,无需昂贵LiDAR或摄像机阵列,实现实时3D场景重建
- 核心模型:“原生3D动态世界模型S1”——全球首个具备真实3D空间构建与动态交互能力的实时世界模型
- 执行机器人:“影身”系列工业机器人——面向柔性智造场景,搭载3D世界模型能力
来源:新浪科技 (2026-04-20)
影身360数据采集系统
- 摄像头数量:4-5个(vs 传统摄像机阵列数十个)
- 单摄像头成本:百元级别(家用级RGB)
- 采集能力:实时3D数据采集与自由视角场景重建
- 对比传统方式:激光采集/摄像机阵列采集数据体量小、成本高、环境局限强
来源:甲子光年 (2026-04-20)
原生3D动态世界模型S1
- 技术定位:全球首家以”原生3D数据”为核心训练输入的具身世界模型(vs Genie像素生成派、Marble 3D重建派)
- 训练效率:同样是仿真结果,3D数据训练效率是视频训练的20倍
- 输出能力:同步生成场景三维几何表征 + 预测视频 + 直接驱动动作(Action)序列
- 架构:V-4D-A(视觉-4D-动作)——打通”3D数据获取—模型训练—物理运行—场景落地”闭环
来源:甲子光年 (2026-04-20) + 新浪科技 (2026-04-20)
技术路线
核心判断:第三条路
影身智能有三个核心技术判断,构成其与行业主流路线的差异:
- VLA的根本缺陷:传统VLA(Vision-Language-Action)依赖二维像素统计拟合,无法真正理解三维空间的深度、体积与动力学关系,本质是”通过触碰照片感知世界”
- 语言并非最优媒介:物理动作的时空连续性与语言符号的高度离散性存在根本矛盾;应”将视频语言化”,直接从视频数据提取物理世界信息
- 3D数据不是选配而是必配:绕道2D(如Genie/World Labs的Marble)是因为3D数据获取困难;影身360系统用低成本方法解决了这一瓶颈
来源:甲子光年 (2026-04-20)
Real2Real数据生成范式
- 数据来源:利用国内海量视频数据 + 工厂交叉视角摄像头(工人上方和前方)
- 数据生成逻辑:时空智能大模型处理无标签视频数据 → 生成两部分数据:
- ① 工人关节位置和姿态的动捕数据,映射到机器人关节
- ② 模拟工人视角的视频数据(类似遥操作训练数据)
- 生产影响:无需额外复杂设备,不干扰工厂正常生产秩序,实现”生产与训练并行”
- 小模型部署:大模型生成的训练数据 → 训练端上小模型 → 部署到统一硬件本体
来源:36氪 (2025-04-16)
数据飞轮
- 闭环:工厂产线部署 → 每台机器人作业同步收集真实物理数据 → 反向喂养世界模型迭代
- V-4D-A架构引擎:3D数据获取 → 模型训练 → 物理本体运行 → 工业场景落地
来源:新浪科技 (2026-04-20)
与主流路线的差异化
| 维度 | 影身智能(原生3D派) | Genie(像素生成派) | Marble(3D重建派) |
|---|---|---|---|
| 训练输入 | 原生3D数据 | 2D视频帧序列 | 2D→显式3D重建 |
| 物理一致性 | 天然保证(3D几何表征) | 无明确物理一致性保证 | 闪烁/畸变/穿模问题 |
| 效率 | 参考值:训练效率=视频20倍 | 数据集大但冗余高 | 计算密集 |
来源:甲子光年 (2026-04-20)
商业验证
切入场景:柔性智造(制鞋)
- 目标行业:制鞋涂胶工艺(典型”双柔性”场景:柔性材料皮革/织物 + 柔性工序高频SKU迭代)
- 核心痛点:传统自动化无法适配鞋型复杂曲面;人工涂胶存在苯中毒职业健康风险
- 方案效果:影身世界模型搭载工业机器人,实现毫米级精度涂胶,无需灵巧手
来源:甲子光年 (2026-04-20)
商业成果
- 订单规模:斩获国内首个具身智能”千万级柔性智造”订单
- 生产效率:8小时生产3000双鞋(不同款式/订单频繁切换,无需人工干预与调试)
- 交付目标:2025年累计交付上百台机器人(据36氪2025-04-16报道)
来源:甲子光年 (2026-04-20) + 36氪 (2025-04-16)
扩张路径
- 第一阶段:轻工业柔性制造(制鞋 → 制衣等)
- 第二阶段:快递、酒店等服务行业
- 第三阶段:C端家庭场景(AGI终极目标)
- 战略逻辑:“先难后易”——柔性智造对世界模型复杂度要求最高,拿下后形成降维打击
来源:甲子光年 (2026-04-20)
融资历史
| 轮次 | 金额 | 时间 | 投资方 |
|---|---|---|---|
| 种子轮 | 数千万元 | 2024 | 卓源亚洲、杭州西湖科创投 |
| 天使轮 | — | 2026-Q1(3个月内) | 恒生电子(领投)、松禾资本、杭州润苗基金、北京未来星、东莞人才基金 |
| 天使+轮 | — | 同上 | 同上跟投 |
| Pre-A轮 | 数千万 | 2026-04-20公布 | 深高投(领投)、晓池资本、卓源亚洲(老股东跟投) |
累计:种子+天使+天使++Pre-A ≈ ¥近亿元
来源:投资界 (2026-04-20) + 新浪科技 (2026-04-20)
竞争定位
在”世界模型赛道”中的独特位置
- 差异化选择:同行(Genie/Marble)从2D数据做升维 → 影身直接从原生3D数据建世界模型
- 成本优势:数采系统只需4-5个百元级摄像头,vs 传统3D采集(LiDAR/摄像阵)需数十万设备
- 数据飞轮:不是纯软件公司——通过硬件部署(工业机器人)产生真实物理交互数据,形成闭环
主要对标 / 参照
- Google DeepMind Genie:像素生成派,无物理一致性保证
- World Labs (Fei-Fei Li) – Marble:3D重建派,但底层仍是2D→3D,存在穿模问题
- Generalist AI:~27万小时遥操作数据,而非原生3D路径
- 蚂蚁灵波 – LingBot-VA:开源,VLA+世界模型混合
来源:甲子光年 (2026-04-20)
核心优势
- 技术独特性:全球首家以”原生3D动态世界模型”为核心路线的具身智能公司
- 场景壁垒:柔性智造(制鞋涂胶)是工业界最难攻克的”双柔性”场景,验证了模型泛化力
- 成本模式:数采≠烧钱,百元级摄像头 vs 行业遥操作/仿真合成两种主流路径的巨量投入
核心风险
- 数据规模存疑:目前仅制鞋单一工业场景,3D数据体量远小于互联网2D视频的可用规模
- 路线未被验证:行业主流选择2D→3D升维路径有深层原因——原生3D数据的规模化生产仍是业界公认难题,影身360系统尚未证明可覆盖复杂泛化场景
- 盈利模式未清晰:目前千万级订单 vs 累计近亿元融资,ROI路径不明
- 竞品多线夹击:VLA路线(星海图/自变量/千寻)和世界模型路线(智元Genie/蚂蚁LingBot/Marble)均获大量资源
来源:甲子光年 (2026-04-20) — Talos自研判断
动态记录
- 2026-04-20:影身智能宣布连续完成天使轮+天使+轮+Pre-A轮合计近亿元融资;投资界/新浪科技/东方财富等多家媒体报道 投资界
- 2026-04-20:甲子光年发布深度报道《用原生3D数据重新定义机器人认知》,完整披露技术路线(V-4D-A架构)、数据策略(影身360/Real2Real/20倍效率)、商业场景(制鞋8h 3000双)和团队细节(刘烨斌杰青+孟子阳万人计划)甲子光年
- 2025-04-16:36氪硬氪首发种子轮报道;披露视频语言化技术理念、影身系列工业机器人发布、千万级订单、2025年百台交付目标 36氪
- 2024-06:杭州影身智能技术有限公司成立 天眼查 (2026-06-03访问)