在当今汹涌澎湃的科技浪潮中,越来越多年轻人正在成为破局者。
最近 Deepseek 震动全球科技圈后,其背后的年轻团队引人注目。而在人形机器人行业,年轻人同样在不断崭露头角。
2 月 6 日,一家由几位00 后创办的人形机器人公司——零次方机器人宣布完成数千万元天使轮融资,并拿下千万级订单,进入量产阶段,预计今年将量产 500 台人形机器人并实现落地。
零次方机器人曾在短短 5 个月内发布了两款人形机器人,并且提出了独特的数据收集与机器人训练方案:
无需遥操设备,机器人只需要通过摄像头观察人类行动,就能收集数据,并结合互联网人类行为视频学习执行相应任务。
公司早期的几位创始人都来自清华大学,为人工智能专业。
现今团队中还有来自百度、字节跳动、科大讯飞、美的等大厂的科技人才,是「高校年轻人才+大厂资深人才」的配置,兼具创新力与商业落地的丰富经验。
在机器人行业仍深陷「数据饥渴症」的当下,这支年轻团队正试图用互联网上的海量真实人类行为视频数据,破解具身智能的密码。
利用人类视频数据训练
成本降低 99%
零次方机器人成立于 2025 年 1 月,由清华大学和江淮前沿技术协同创新中心联合孵化。
不过,零次方团队早在 2024 年 5 月就已成立,并在极短的时间内快速推出了两款人形机器人产品,分别是 2024 年 9 月推出的 P1,和 2024 年 10 月推出的 Z1。
零次方的核心技术成果之一:基于人类视频数据学习,也应用在这两款人形机器人身上进行展示。
P1 是双臂人形机器人,能够通过观察人类演示进行学习,为月饼压模、装盒。
Z1 则在 P1 基础上加上了双足,全身具备27 个自由度,可负重 20kg,能够在草地-石阶、鹅卵石等多种复杂路面长时间稳定行走,也具备较强鲁棒性,能够抵抗外部击打,让自己保持平衡。
Z1 同样能通过模仿人类进行学习,比如模仿学习人类拳击手运动,复刻了电影《钢甲铁拳》的经典画面。
零次方团队认为,数据量是实现通用具身操作的必需因素,单位数据成本是产品落地的基础条件。
现今人形机器人主流的训练数据收集方式有两个,一是遥操设备收集,二是仿真平台合成。这两种数据收集方案都面临单位成本高的问题。
零次方另辟蹊径,选择利用人类视频数据,这类数据最主要的来源是互联网,量大且成本较低。
同时零次方还通过简化数据收集方式,极大地降低视频数据收集成本,更快开展训练。
整个数据收集和利用的具体方法分为以下几步:
1、通过三维人体运动姿态感知模型提取人类关键关节的运动数据,并重映射到机器人身上,省去人类使用遥操作设备的学习成本;
2、借助 4D 高斯溅射技术重建机器人观测信息,用完整数据训练 Transformer-Based Diffusion Policy,让机器人能自主完成任务,直接向人类学习;
3、基于向人类的学习方式,机器人构建出一个基础模型,在仿真训练中强化学习,弥补人机结构差异;
4、快速部署之后,机器人可根据专项场景的数据以及互联网数据,训练想象生成模型,再将生成数据和真实数据混合使用;
5、想象生成模型在训练中能力不断提升,想象能力越来越逼近真实世界,所需的真实数据逐渐减少,生成数据的比例越来越高,算法的泛化性也随之增强,部署效率因此提高,从而实现数据飞轮效应。
概括来说就是,机器人观察人类行动并进行模仿,然后构建一套向人类学习的范式,在仿真环境中加强训练,之后将机器人部署到现实场景中,依据场景和互联网视频数据训练一个具备想象力很强的模型,减少真实数据依赖,提升算法泛化性。
针对数据收集,也就是上述步骤中的第一步,零次方还研发出一套低成本单目摄像头视觉重映射机器人控制方案。
机器人只需要通过一个廉价的 RGB 摄像头,就能够捕捉人类的行动并进行模仿。
这种方案经济且高效,它的延迟低于 150 毫秒,硬件成本较传统的动捕技术下降了99%,具备更低的部署成本和更广泛的适用性。
解决特定场景下操作问题
将推出最安全的机器人
近年来人形机器人企业数量呈现爆发式增长,但横亘在所有企业面前的一个巨大难题是,由于技术限制,人形机器人目前还无法完成商业化。
哪怕是资金雄厚、人才充足的特斯拉都尚未解决这个难题,Optimus 目前仍然只能在工厂完成分拣电池的简单工作。
因此,作为一家初创企业,零次方机器人在研发人形机器人之外,还在同步开发机器人应用解决方案,在储备技术的同时,探寻这些细分技术商业落地的可能性。
目前他们的机器人相关的解决方案有三个:
重映射机器人控制方案(前文已述);
专有场景泛化操作方案;
避障算法。
零次方的专有场景泛化操作方案能够帮助机器人理解并执行特定场景下的任务,比如让机械臂机器人叠衣服、抓取并放置不同形状物体。
具体流程是,零次方团队先针对特定场景中的任务步骤进行规范化,随后调用视觉语言大模型理解环境,将场景中的各类信息转化为机器人能够理解的任务流程。
机器人在实际执行的过程中,会分析任务的类别,从而选择不同的解决方案。
零次方将任务划分为两类,分别是长距离移动操作任务和局部长序列操作任务。
两类任务的区别主要是,前者机器人是移动操作,后者主要是定点操作。
长距离移动操作任务一般包括快递配送、户外巡检等。零次方团队为这类任务研发出通用抓取放置模型 GP-6D。
GP-6D 可以通过利用视觉语言大模型与 3D 场景关系图生成最优的放置位姿,结合自外感知规划实现无碰放置,攻克目前多数机器人尚未解决的放置问题。
局部长序列操作任务一般包括手术操作、生产线装配等,涉及的步骤较多,容易产生级联误差传播问题。(级联误差传播问题是指在一系列连续的操作步骤中,前一个操作步骤产生的误差会累积并影响到后续操作步骤)
为减少操作误差,零次方团队提出了基于模块化动作基元的复合策略生成框架。
该框架将构建一个面向操作对象泛化的技能表征体系,将复杂任务分解为可组合的动作基元,通过对库中各项动作基元的筛选组合来完成任务。
简单来说,机器人会拥有一个包含各种通用性技能的技能库,当它需要执行任务时,会将任务拆分为多个步骤,并且从技能库中提取出每个步骤对应的技能,再将这些技能组合,从而完成任务。
此外,零次方团队创新性提出了 IRL 的训练框架,将模仿学习的高效性和强化学习的鲁棒性结合,并通过现实与仿真迭代交替的方式实现泛化,以保证技能的成功率。
避障算法也是零次方的机器人应用解决方案之一。
基于大量的市场用户测试反馈,零次方全面重构了现有稳定版本,让机器人实现了动静态的全身避障。
并且,零次方宣称将基于「机器人三安全法则」——对人类安全、对环境安全、对本体安全,推出最「安全」的人形机器人。
虽然零次方的机器人现阶段于实际落地应用中尚未呈现出显著成效,但千万级订单的获得,印证了这场始于实验室的技术革命,正在通过中国年轻一代的创新基因,加速转化为可触摸的商业现实。
成为付费用户可以阅读 零次方机器人 所有资料
了解更多 →