电子发烧友网报道(文/梁浩斌)在近年来,在关节材料和电机技术的进步下,人形机器人的运动能力越来越强,在机器人“小脑”,也就是平衡、运动算法上取得了突破,让人形机器人能够实现接近于人类的动作流畅度,甚至能完成一般人无法完成的杂技动作。
而在机器人硬件基础逐步提高的前提下,也就成为了机器人“大脑”开发的基石,真正让人形机器人走向“具身智能”。最近有消息称,特斯拉正在利用一支数据采集团队,来训练Optimus机器人像人类一样自主行动。那么具体是如何做的?
延续纯视觉路线,百人团队采集训练数据
根据报道,特斯拉数据采集团队在鼎盛时期拥有超过100名员工,在8小时的轮班中,数据采集员需要根据任务指派文件和操作手册,重复数百次包括奔跑、蹲下、舞蹈、拿杯子、擦桌子、拉窗帘等动作,以确保数据采集工作正确完成。
值得一提的是,特斯拉在此前是使用动作捕捉服或是远程手动控制机器人来采集数据。而今年6月,特斯拉开始改用纯摄像头采集数据,这与其自动驾驶的技术路线相同。团队成员被告知,不采用动作捕抓服后,数据采集的工作效率会更高。除了环境周围的摄像头外,数据采集员工需要穿戴头盔和背包,搭载5台摄像头记录全程的动作。
特斯拉数据采集团队的前员工表示,目前远程操控功能主要被用于接待投资者参观时使用。“投资者们希望看到这些机器人实际运行起来,演示时我们会使用动作捕抓手动控制这些机
器人,这样整个操作过程看起来才会更加流畅自然”。
与自动驾驶类似,人形机器人实际上也需要海量的数据训练,数据是泛化能力的核心。但问题在于,相比自动驾驶能够通过路测和仿真来采集数据,目前针对人类动作记录的数据获取要麻烦得多。人形机器人的路线规划可以与发展多年的自动驾驶类似,但动作、触觉等仍需要大量真实数据,因为不同材料、不同形状的物体需要机器人灵巧手对其施加不同的力,以及不同的抓取方式。
目前机器人主要的数据采集方式有几大类,包括真实场景采集、仿真环境、多模态融合采集、人机协作与自主生成等。
真实场景采集是通过在实际环境中部署机器人,直接收集传感器数据。例如上海智元数据采集中心构建了家居、工业、商超等五大类真实场景,利用 100 余台机器人每日采集超万条数据。这类数据能提供最真实的环境反馈,解决仿真数据与现实的 “域差距” 问题,但成本较高。为提升效率,智元采用模仿学习与强化学习结合的路径:前者通过人类示范总结规律(如机械臂分拣动作),后者通过奖励机制让机器人在试错中优化策略。
仿真环境是利用物理引擎构建虚拟世界,生成包含传感器信号(视觉、力觉等)的训练数据,批量生成低成本数据。这种数据采集技术,依赖精确的物理建模(如关节刚度、摩擦系数)和渲染引擎;需要支持大规模参数随机化以增强数据多样性;最终输出为可直接用于模型训练的原始传感器数据或标注数据集。
多模态融合采集则是整合多种传感器数据以提升环境感知精度,其中也有几种技术路线。
数据级融合:直接对齐原始信号,如将 LiDAR 点云与摄像头图像投影到同一坐标系;
特征级融合:在神经网络中层融合视觉特征与 IMU 运动数据,例如 MVX-Net 通过注意力机制混合图像纹理与点云几何信息;
决策级融合:独立运行单模态模型后整合结果,如百度 Apollo 结合摄像头 YOLO 模型与 LiDAR 检测进行障碍物判断。
人机协作与自主生成则分别是两种数据采集方式,首先人机协作是类似于使用动捕装置生成动作轨迹,将人的动作映射到机器人上;自主生成则是机器人根据模型不确定性自主选择高价值数据点,减少对人类标注的依赖。
但总体来看,多模态融合采集是当前主流的数据采集方案。
当前机器人仍离不开远程操控
另一家最近在网上爆火的挪威人形机器人公司1X Technologies,他们宣布了旗下NEO人形机器人将会在2026年出货,并开始预售,售价仅2万美元,甚至公司还提供了6个月499美元的租赁计划。
而NEO机器人的定位是家庭服务机器人,在宣传片中NEO能够自动完成打扫、开门、整理衣服、将衣物放入洗衣机、将餐具放入洗碗机并启动、拿饮料等工作。许多人看完后已经开始想象未来所有家务交给机器人的场景。
然而最近WJS的记者在体验以及采访了1X CEO Bernt Børnich之后,却发现实际情况要远远落后于人们预期。目前,NEO的所有动作,都由戴着VR眼镜和操作手柄的工作人员在远程控制。另一方面,机器人的行走速度缓慢、动作同样较为拖沓,工作效率低下。而更重要的是,利用VR控制机器人的工作人员,将会获得用户房间内的视频信息,这对用户个人隐私造成很大的威胁。
当然1X表示预计到2026年,Neo将自主执行大多数家务,通过人工指导的过程来让机器人收集真实世界数据,并进行学习。但也有可能跟很多超前的科技产品一样,2026年只是一个目标,实际的量产落地时间还是未知数。
小结:
综合来看,当前人形机器人的发展正处在硬件基础发展迅速,与数据采集、AI训练起步的关键交汇期。关节材料、电机技术的突破与平衡算法的升级,为机器人赋予了接近人类的动作潜力;而行业内多样化的数据采集模式,共同构成了机器人向“具身智能”迈进的核心支撑。未来人形机器人真正要走进家庭,还需要面临大量的现实问题,包括安全、隐私、自主决策等,从演示级产品到实用产品,可能还要等待很长的时间。
而在机器人硬件基础逐步提高的前提下,也就成为了机器人“大脑”开发的基石,真正让人形机器人走向“具身智能”。最近有消息称,特斯拉正在利用一支数据采集团队,来训练Optimus机器人像人类一样自主行动。那么具体是如何做的?
延续纯视觉路线,百人团队采集训练数据
根据报道,特斯拉数据采集团队在鼎盛时期拥有超过100名员工,在8小时的轮班中,数据采集员需要根据任务指派文件和操作手册,重复数百次包括奔跑、蹲下、舞蹈、拿杯子、擦桌子、拉窗帘等动作,以确保数据采集工作正确完成。
值得一提的是,特斯拉在此前是使用动作捕捉服或是远程手动控制机器人来采集数据。而今年6月,特斯拉开始改用纯摄像头采集数据,这与其自动驾驶的技术路线相同。团队成员被告知,不采用动作捕抓服后,数据采集的工作效率会更高。除了环境周围的摄像头外,数据采集员工需要穿戴头盔和背包,搭载5台摄像头记录全程的动作。
特斯拉数据采集团队的前员工表示,目前远程操控功能主要被用于接待投资者参观时使用。“投资者们希望看到这些机器人实际运行起来,演示时我们会使用动作捕抓手动控制这些机
器人,这样整个操作过程看起来才会更加流畅自然”。
与自动驾驶类似,人形机器人实际上也需要海量的数据训练,数据是泛化能力的核心。但问题在于,相比自动驾驶能够通过路测和仿真来采集数据,目前针对人类动作记录的数据获取要麻烦得多。人形机器人的路线规划可以与发展多年的自动驾驶类似,但动作、触觉等仍需要大量真实数据,因为不同材料、不同形状的物体需要机器人灵巧手对其施加不同的力,以及不同的抓取方式。
目前机器人主要的数据采集方式有几大类,包括真实场景采集、仿真环境、多模态融合采集、人机协作与自主生成等。
真实场景采集是通过在实际环境中部署机器人,直接收集传感器数据。例如上海智元数据采集中心构建了家居、工业、商超等五大类真实场景,利用 100 余台机器人每日采集超万条数据。这类数据能提供最真实的环境反馈,解决仿真数据与现实的 “域差距” 问题,但成本较高。为提升效率,智元采用模仿学习与强化学习结合的路径:前者通过人类示范总结规律(如机械臂分拣动作),后者通过奖励机制让机器人在试错中优化策略。
仿真环境是利用物理引擎构建虚拟世界,生成包含传感器信号(视觉、力觉等)的训练数据,批量生成低成本数据。这种数据采集技术,依赖精确的物理建模(如关节刚度、摩擦系数)和渲染引擎;需要支持大规模参数随机化以增强数据多样性;最终输出为可直接用于模型训练的原始传感器数据或标注数据集。
多模态融合采集则是整合多种传感器数据以提升环境感知精度,其中也有几种技术路线。
数据级融合:直接对齐原始信号,如将 LiDAR 点云与摄像头图像投影到同一坐标系;
特征级融合:在神经网络中层融合视觉特征与 IMU 运动数据,例如 MVX-Net 通过注意力机制混合图像纹理与点云几何信息;
决策级融合:独立运行单模态模型后整合结果,如百度 Apollo 结合摄像头 YOLO 模型与 LiDAR 检测进行障碍物判断。
人机协作与自主生成则分别是两种数据采集方式,首先人机协作是类似于使用动捕装置生成动作轨迹,将人的动作映射到机器人上;自主生成则是机器人根据模型不确定性自主选择高价值数据点,减少对人类标注的依赖。
但总体来看,多模态融合采集是当前主流的数据采集方案。
当前机器人仍离不开远程操控
另一家最近在网上爆火的挪威人形机器人公司1X Technologies,他们宣布了旗下NEO人形机器人将会在2026年出货,并开始预售,售价仅2万美元,甚至公司还提供了6个月499美元的租赁计划。

然而最近WJS的记者在体验以及采访了1X CEO Bernt Børnich之后,却发现实际情况要远远落后于人们预期。目前,NEO的所有动作,都由戴着VR眼镜和操作手柄的工作人员在远程控制。另一方面,机器人的行走速度缓慢、动作同样较为拖沓,工作效率低下。而更重要的是,利用VR控制机器人的工作人员,将会获得用户房间内的视频信息,这对用户个人隐私造成很大的威胁。
当然1X表示预计到2026年,Neo将自主执行大多数家务,通过人工指导的过程来让机器人收集真实世界数据,并进行学习。但也有可能跟很多超前的科技产品一样,2026年只是一个目标,实际的量产落地时间还是未知数。
小结:
综合来看,当前人形机器人的发展正处在硬件基础发展迅速,与数据采集、AI训练起步的关键交汇期。关节材料、电机技术的突破与平衡算法的升级,为机器人赋予了接近人类的动作潜力;而行业内多样化的数据采集模式,共同构成了机器人向“具身智能”迈进的核心支撑。未来人形机器人真正要走进家庭,还需要面临大量的现实问题,包括安全、隐私、自主决策等,从演示级产品到实用产品,可能还要等待很长的时间。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
特斯拉
+关注
关注
66文章
6404浏览量
130987 -
人形机器人
+关注
关注
7文章
879浏览量
18266
发布评论请先 登录
相关推荐
热点推荐
目标年产1000万台!特斯拉筹备扩建得州超级工厂用于量产Optimus人形机器人
11月11日,特斯拉确认筹备再度扩建得克萨斯超级工厂,拟建设一座面向人形机器人Optimus的专用厂房,以支撑后续量产。公司表示,Optimus
蓝思科技:今年承接智元机器人全系列多款人形机器人业务
电子发烧友网综合报道 8月4日,蓝思科技在接受调研时披露公司在人形机器人领域的最新进展。蓝思科技表示,2024年起已为合作伙伴交付数百台整机,今年则承接了智元机器人全系列多款
特斯拉人形机器人,今年内在中国市场推出?
电子发烧友网综合报道 近日有消息称,目前特斯拉第三代人形机器人,Optimus V3已经在美国工厂实测,预计今年会面向中国C端市场推出,进入家庭等消费级场景。预计
借助OpenUSD与合成数据推动人形机器人发展
适用于合成运动数据的 NVIDIA Isaac GR00T Blueprint 大幅加快人形机器人的数据生成和训练速度。
广汽集团荣登全球人形机器人百强榜单
名单,广汽集团凭借在人形机器人领域显著的技术创新、独特的市场定位与商业规划,以及深厚的技术积累与成熟的供应链体系等优势成功上榜,与英伟达、微软、谷歌、特斯拉等科技公司共同入围百强榜单。
特斯拉加速推进Optimus人形机器人量产
特斯拉近日在其位于美国弗里蒙特的超级工厂内,发布了多个关键工程岗位的招聘信息。这一举动标志着特斯拉正在加速推进其备受瞩目的人形机器人——Optimu
全国首个异构人形机器人训练场启用
,首期已部署超过100台异构人形机器人。其设有综合运动训练区、通用基础抓取操作区等多个功能区域,机器人可在此进行各种针对性训练。
马斯克展望人形机器人与自动驾驶未来
此为起点,于2026年将产量扩大至50,000至100,000台,随后在次年再实现10倍的增长。这一雄心勃勃的目标彰显了特斯拉对于人形机器人市场的乐观预期及强劲信心。 此外,马斯克在一次游戏直播活动中透露,

特斯拉Optimus百人团队采集训练数据,人形机器人仍全靠遥控?
评论