人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元

1 引言

本篇报告为《人形机器人系列深度报告》第四篇,详细解读海外人形机器人产业化发展历程,梳理拆解多元化技术路线探索,分析研判海外科技巨头、头部初创公司技术布局与商业化路径。我们认为,当前人形机器人产业化奇点已至,看好海外机器人产业链长期增量空间。

海外人形机器人产业化加速,迈向量产新纪元。海外人形机器人产业历经萌芽探索、集成发展、高动态发展及智能化发展四大阶段,技术路线呈现仿生模拟与功能学习双轨并行格局。日本侧重形态仿生与服务应用,而美国引领功能学习与复杂环境操作产业化。欧洲多国则多元化创新。竞争格局上,科技巨头通过全栈布局、内生发展及外延拓展三线并进,美国凭借 AI 积累强势领跑,初创公司数量与中国持平,近 10 年融资额达 13.7 亿美元居全球首位。发展趋势凸显大模型深度赋能,Figure AI 的 Helix VLA 模型突破跨场景泛化,Physical Intelligence 的 Hi Robot分层架构提升指令跟随准确率 40%,端到端模型加速执行效率质变;应用落地聚焦工业制造、物流仓储及家庭服务三大场景,产业化拐点已至,建议关注强客户卡位与量产能力的汽配供应链企业。

2 海外人形机器人:大模型赋能 迈向具身智能新纪元

2.1 发展历程:发轫于传统运控 迈向具身智能新时代

海外人形机器人发展历程已经历了萌芽探索、集成发展、高动态发展、智能化发展四个阶段:

1)萌芽探索阶段(20 世纪 60 年代末至 90 年代)

以实现基本的双足行走功能为主要目标。以日本早稻田大学为代表,开发了一系列机器人,如 WAP、WL、WABIAN 和 WABOT 等。这一阶段的主要特点是基本实现双足行走功能和控制能力,初步具备了拟人化的结构,但整体上运动能力较弱。

2)集成发展阶段(21 世纪初至 2010 年)

以感知和智能控制整合为主要特点,本田公司的 ASIMO 系列人形机器人代表了这一阶段的重大进展,通过感知和智能控制技术的整合,机器人具备了初步的感知系统,能够感知周围环境的基本信息,并根据感知输入做出简单判断并调整动作。

ASIMO 200 是其中的代表作,不仅外观类人,还能预测未来动作并主动调整重心,实现转弯时的流畅行走。

3)高动态发展阶段(2010 年至 2022 年)

控制理论和技术的进步提升了机器人的认知能力,使其能够独立、稳定地执行复杂动作,且此阶段人形机器人已经具备了较强的运动能力。如本田的升级版ASIMO 机器人采用电驱动的技术路线,并通过整合视觉和触觉物体识别技术,能够精确完成抓取物体和倒液体等精细任务。波士顿动力的 ATLAS 机器人采用液压驱动的技术路线,能够在具有挑战性的场景中保持平衡并实现高动态运动。

4)智能化发展阶段(2022 年至今)

2023 年,大型语言模型的快速进步加速了具身智能的出现。在人工智能技术的赋能下,机器人具有了更加智能化的感知、交互和决策能力。同时,电驱动成为“肢体”主流技术路线,实现了更加精准的行走和操作,并提高了研发迭代速度。如特斯拉 Optimus 机器人,基于人工智能技术和自研的 FSD 芯片,通过端到端的神经网络模型实现任务级和动作级的决策,以及复杂环境中物体、人脸和手势等的识别。同时,通过其全身压力计算和实时反馈机制,使机器人的四肢运动更加灵敏,能够实现流畅和自然的动作。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

2.2 技术路线:仿生与功能方向并行 技术探索多元化

海外人形机器人的主要研究方向可分为仿生模拟、功能学习两大类,其中日本以形态模拟见长,为人形机器人行业开创者;美国以功能学习见长,引领人形机器人产业化落地:

1)日本:对人形机器人的研究主要侧重于仿生模拟,重点开发复杂且逼真的仿生机器人,主要面向家庭和服务应用。

早稻田大学 1976 年开创性地推出了 WABOT 系列机器人,首次成功实现了双足行走技术,并通过与东京大学和国家先进工业科学技术研究所(AIST)合作,在双足运动、控制算法和人机交互领域持续保持领先地位;

本田著名的 ASIMO 机器人源自 P2 人形步行机器人,尺寸更小,同时进一步提升了行走和工作能力。2011 年的 ASIMO 改进版展示了在崎岖地面行走、语音识别、避开静态和动态障碍物以及多指协调能力;

索尼开发了娱乐性人形机器人 SDR 和 QRIO(2003 年推出),能够唱歌、跳舞、踢球并进行人机交互。

2)美国:人形机器人研究主要侧重于理解人脑的机制和功能学习,在复杂环境中机器人操作方面取得重大进展,为潜在的实际应用奠定了坚实基础。

Willow Garage 的双臂服务机器人 PR2 展示了执行复杂操作的能力,如叠衣服、叠毛巾、开门和自主寻找充电插座;

美国国家航空航天局(NASA)开发了人形双臂机器人 Robonaut 2,在国际空间站上替代宇航员执行危险太空环境中的重复性任务;开发了各种动态且高度移动的机器人;

波士顿动力的 Atlas 机器人具备类似人类的感知、判断和决策技能,展示了穿越传送带、避开障碍物和维持平衡等动态能力;

特斯拉 Optimus 展示了类似人类的灵巧性、平稳行走、弯腰、向观众挥手以及表演简单舞蹈动作的能力。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

3)其他国家:法国、德国、意大利等国在人形机器人领域也展开了多元化创新探索,Pepper、Ameca 等是行业明星产品。

法国 Aldebaran Robotics 开发了各种人形机器人,包括 ROMEO、Pepper和 NAO。NAO 机器人广泛应用于学术领域,享誉全球。ROMEO 主要为个人护理设计,能够观察周围环境并与人类交谈。Pepper 机器人旨在与人类互动,特别是通过人脸表情和声音识别情感并相应调整对话模式。

德国航空航天中心(DLR)开发了 TORO 人形机器人,强调机器人手臂的协调控制和步态控制,以实现安全的人机交互。

意大利理工学院开发的 iCub 人形机器人在人类认知和人工智能研究中发挥重要作用,旨在加深我们对人类认知过程的理解。

西班牙 PAL Robotics 推出了 REEM-C 人形机器人,具备行走、视觉识别和人机交互能力。

英国 Engineered Arts 创造了一个以逼真表情和先进交互能力著称的人形机器人 Ameca,被誉为最像人类的机器人之一。

韩国科学技术院(KAIST)开发的 KHR 系列人形机器人获得了高度认可。HUBO KHR-3 机器人能以直膝步态以 1.4 公里/小时的速度行走,并能以 3.6 公里/小时的速度奔跑。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

2.3 竞争格局:科技巨头持续入局 美国初创公司领跑

海外科技巨头正通过多元化策略加速人形机器人领域布局,内部研发+战略投资+合作赋能三线并行:

1)全栈布局:谷歌于 2025 年 2 月投资 Apptronik,旗下 Deepmind 于 2024年 12 月与 Apptronik 达成战略合作;微软于 2024 年 2 月投资 Figure AI,2024年 5 月与 Sanctuary AI 达成战略合作,2025 年 2 月发布 Magma 多模态基础模型;英伟达 2024 年 2 月发布人形机器人基础模型 GR00T、投资 Figure AI,2025年 2 月与富士康达成合作;

2)内生发展:报道称,苹果 2025 年 2 月开始人形机器人领域探索;Meta于 2025 年 2 月,在 Reality Labs 硬件部门下组建人形机器人专项研发团队;特斯拉自研 Optimus 通用人形机器人,目标为内部应用与商业化销售;

3)外延拓展:亚马逊于 2022 年 4 月投资 Agility、2024 年 7 月投资 SkildAI,并于 2023 年 10 月开始在仓库中应用 Agility 的 Digit 人形机器人;英特尔2023 年 7 月投资 Figure AI;Open AI 于 2023 年 1 月通过 OpenAI Startup Fund 投资 1X Technologies,并成为其合作伙伴,2025 年 3 月开始发力人形机器人自研;三星 2023 年 1 月收购 Rainbow Robotics 的少数股权,2024 年 1 月通过三星 NEXT 投资 1X Technologies。

当前海外科技巨头布局方式呈现两大特征:头部企业侧重技术融合与场景落地,通过资本纽带绑定创新主体;多数玩家避免单一路径依赖,以内外兼修方式降低试错风险。行业仍处资源整合与技术验证阶段,生态协同效应将加速商业化拐点到来。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

2.4 发展趋势:大模型深度赋能 应用落地持续加速

具身大模型作为人形机器人智能化的核心引擎,正持续赋能海外主机厂突破感知-决策-执行闭环的技术瓶颈。Figure AI 自研的视觉-语言-动作(VLA)模型Helix 已实现跨场景任务泛化,支持机器人在物流分拣中完成从零样本学习到动态包裹处理的升级;1X Technologies 依托 OpenAI 投资强化具身学习架构,通过VR 远程操作积累真实动作数据训练 Neo 机器人,结合世界模型仿真优化家庭场景的咖啡制作、洗衣等长周期任务泛化能力;Physical Intelligence 推出的分层交互系统 Hi Robot 创新性整合高层推理 VLM 与底层执行 VLA 模型,在开放式指令跟随准确率上超越 GPT-4o 达 40%,为 Agility Robotics 等合作伙伴提供动态纠错与复杂任务分解能力。技术路径上,分层架构因模块化与可解释性优势暂居主流,但端到端模型随数据积累(如谷歌 RT-2)正推动执行效率质变,2025 年成为人形机器人智能化跃迁的关键拐点。

2.5 小结

发轫于传统运控,迈向具身智能新时代。海外人形机器人产业已历经四个清晰的发展阶段:萌芽探索以日本早稻田大学 WABOT 系列为代表,核心目标是实现基础双足行走功能;集成发展标志性事件是本田 ASIMO 的推出,其整合了初步感知系统,实现了环境交互与动作预测;高动态发展期(2010-2022 年)得益于控制理论的进步,机器人的运动能力显著提升,本田升级版 ASIMO 与波士顿动力Atla 分别在电驱与液压路线上实现了复杂环境下的精细操作与高动态平衡;智能化发展阶段则深度融合大型语言模型,赋予机器人智能化感知、交互与决策能力。

3 特斯拉:Optimus 量产在即 2027 年有望出货百万台

3.1 软件端:运动能力显著提升 功能有望快速迭代

2023 年以来,Optimus 软件端进展迅猛,运动能力显著提升,功能性有望持续快速迭代:

1)上肢能力:进化主要在 2023 年,2024 年初已经能够实现柔性物体叠放的复杂功能,2024 年底进一步迭代了重物搬运、运动物体抓握能力;

2)下肢能力:2024 年突飞猛进,行走协调性、流畅度大幅提升,已具备类人行走能力,并且能够完成室外行走、自主爬高坡楼梯、复杂地形盲跑和平衡保持等复杂功能,2025 年 5 月已经能够完成流畅舞蹈能力展示,而 2023 年行走步态还较为机械、行走范围仅限于室内;

3)模型训练:2024 年成效显著,Optimus 可用功能丰富度提升明显,2024年已经具备电池单元精确分类、未知空间自主探索与避障、自主充电并返回工位、与人类流畅对话并精确分发物品等一系列能力,2025 年 5 月进一步迭代了倒垃圾、撕厨房纸、操作微波炉等家庭场景任务能力,而 2023 年端到端神经网络训练刚刚开始,仅实现了根据颜色分类物品等基础能力。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

3.2 硬件端:Optimus V3 发布在即 灵巧手/轻量化为优化方向

Optimus 研发进展迅猛,预计 2030 年 Optimus 年产量达 100 万台。特斯拉 Optimus 研发进展迅猛,持续超市场预期:1)2021 年 8 月,在特斯拉首届 AI Day 上,马斯克发布了人形机器人概念机 Tesla Bot,并宣布将于 2022 年推出人形机器人原型机;2)2022 年 9 月,在特斯拉第二届 AI Day 上,人形机器人Optimus 正式推出,已经能够完成能够完成搬运货物、给植物浇水和移动金属棒等工作,但行走还不稳定;3)2023 年 12 月,Tesla Optimus 官方推特发布视频,第二代 Optimus 首次亮相,外观发生较大变化,行走速度、柔顺性、平稳性、操控性能大幅提升。马斯克表示,Optimus 3 将在 2025 年年底推出,并在 2026 年开始量产。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

3.3 小结

软件端:运动能力显著提升 功能有望快速迭代。Optimus 软件端进展迅猛,运动能力显著提升,功能性有望持续快速迭代。2024 年,Optimus 上肢已具备重物搬运、运动物体抓握能力,下肢已具备自主爬高坡楼梯、复杂地形盲跑和平衡保持等复杂功能,功能丰富度明显提升。我们认为 Optimus 运动能力有望进一步提升,崎岖地形步态、速度方向响应、跌倒爬起能力将持续迭代,不断接近人类能力;Optimus 功能性有望不断趋于完善,在特斯拉强大算力储备加持之下,有望能够执行更多有用任务。

硬件端:方案趋于锁定 灵巧手/轻量化为优化方向。随着量产时间渐行渐进,我们预计 Optimus 硬件方案将趋于锁定,产业链供应关系有望进一步明确。Optimus 全新灵巧手拥有 22 个自由度,我们预计 Optimus 新灵巧手采用微型丝杠+腱绳进行传动,由微电机进行驱动。轻量化可大幅优化人形机器人性能,特斯拉尚未其公开轻量化技术方案,我们认为铝/镁合金、PEEK 材料是可能的轻量化材料路径。

4 其他核心主机厂:大模型加速赋能 应用场景持续落地

海外人形机器人硬件百花齐放,头部厂商产业化进展不断加速:1)Figure AI:推出首个人形 VLA 模型 Helix,开启双机协作新时代;发布 BotQ 人形机器人工厂,与 Open AI、宝马等开展商业化合作;斩获多轮融资,是全球融资最多、估值最高的人形机器人初创企业;2)Boston Dynamics:深耕机器人领域四十载,缔造人形机器人领域传奇;从液压转向电驱,Altas 惊艳世界;积极与英伟达、RAI研究所、本田研究所开展合作;3)1X Technologies:NEO Gamma 全新发布,软硬件迎来全面升级;1X 是首家实现商业化销售的人形机器人公司,备受资本市场青睐;4)Sanctuary AI:Phoenix 8 采用轮式设计,搭载全新触觉传感器;拥有 21 个自由度的液压灵巧手,能够实现手内操作;5)Agility Robotics:Digit加速量产,开启物流自动化新篇章;全球首家人形机器人工厂 RoboFab 已正式投产,目标年产能 1 万台;与亚马逊、舍弗勒、GXO 开展商业合作,是第一家能赚钱的人形机器人企业;6)Apptronik:全球估值仅次于 Figure AI 的人形机器人独角兽,谷歌参投 3.5 亿美元 A 轮融资;与谷歌、奔驰、GXO 和捷普合作,推动Apollo 商业化加速落地。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

4.1 Figure AI:首个人形 VLA 模型 Helix 开启双机协作新时代

Figure AI 是全球领先的人形机器人独角兽企业。Figure AI 由 Brett Adcock 于 2022 年创立,总部位于美国硅谷,旨在开发具有自主能力的通用人形机器人,以解决劳动力短缺问题,并在制造业、物流、仓储和零售等领域实现广泛应用。在产品技术方面,Figure AI 推出了 Figure 01 和 Figure 02 以及首个人形 VLA 模型 Helix;在投融资方面,Figure AI 是全球融资最多、估值最高的人形机器人初创企业;在商业化落地方面,Figure AI 发布人形机器人工厂 BotQ,并与 OpenAI、宝马等开展合作,积极推动人形机器人的应用。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

4.2 Boston Dynamics:从液压到电驱 Altas 惊艳世界

波士顿动力(Boston Dynamics)深耕机器人领域四十载,缔造人形机器人领域传奇。

波士顿动力的发展历程可以大致分为以下四个阶段:

1)军方合作:诞生 BigDog 四足机器人和 Altas 原型机。1983 年,创始人马克·雷伯特造出了一台单足机器人,可以蹦跳移动,平衡性极好。1992 年,马克·雷伯特成立了波士顿动力。早期,波士顿动力主要服务美国军方,获得美国军方超千万美元投资,推出四足机器人 BigDog、阿尔法狗 LS3、四足机器人 Cheetah(猎豹)和可自由跳跃旋转的 Wildcat(野猫)等产品。2009 年,波士顿动力改进出人形双足机器人 Petman。2013 年,由 Petman 迭代而成的 Altas 原型机正式亮相。

2)谷歌阶段:Altas 进一步进化,推出 Spot 四足机器人。2013 年,波士顿动力被谷歌收购,停止与军方的合作。2016 年 2 月,第二代 Altas 正式亮相,采用激光雷达和机器视觉,实现自主导航、定位和行走。2015 年 2 月,波士顿动力发布 Spot 四足机器人;后续推出 Spot Mini 版本。

3)软银阶段:Altas 飞速进化,开启商业化进程。2017 年,软银集团获得波士顿动力的控制权。在软银控股期间,Altas 飞速进化,2017 年完成后空翻,2020年完成跑酷,2021 年完成体操。2020 年 6 月,波士顿动力开启商业化之路,SpotMini 以 7.45 万美元(折合约 50 万元)的价格发售。2020 年 H2,波士顿动力宣布 Spot 四足机器人进军加拿大和欧洲市场。

4)现代汽车阶段:探索人机协作新可能。2020 年底,现代汽车以 9.21 亿美元的价格接手波士顿动力,2021 年 6 月完成收购。2022 年 9 月,现代汽车和波士顿动力启动新的波士顿动力人工智能研究所,初始投资超过 4 亿美元。2024 年4 月,液压版 Altas 宣布退役,波士顿动力推出电驱版 Altas。2024 年 10 月,波士顿动力发布电驱版 Altas 进厂实训视频,全程自主完成任务。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

4.3 1X Technologies:NEO Gamma 全新发布 软硬件全面升级

1X Technologies(以下简称 1X)是全球知名的人形机器人科技公司,也是首家实现商业化销售的人形机器人公司。2014 年,Bernt Øivind Børnich 创立 1X的前身 Halodi Robotics,旨在打造于人类一起劳动的通用机器人。2018 年,1X开发世界上扭矩比最高的驱动伺服电机 Revo1,Revo1 专为低传动比机器人何柔性机械装置量身打造。2020 年,1X 发布了轮式人形机器人 EVE。2022 年,1X 在全球客户的工厂中部署了轮式人形机器人 EVE,开始自主处理工业任务。2023年,1X 转向 C 端家庭场景,开始建造人形机器人 NEO。2024 年,1X 推出专为家庭设计的双足机器人原型 NEO Beta。2025 年,1X 推出最新款家用机器人 NEO Gamma。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

4.4 Sanctuary AI: Phoenix 8 采用轮式设计 搭载全新触觉传感器

Sanctuary AI 是一家领先的加拿大科技公司,致力于打造世界上第一个类人类智能通用体。Sanctuary AI 由 Geordie Rose, Suzanne Gildert, Olivia Norton和 Ajay Agrawal 于 2018 年共同创立,总部位于加拿大温哥华。Sanctuary 团队的成员创立了 D-Wave(量子计算行业的先驱)、Kindred(首次在生产机器人中使用强化学习)和 Creative Destruction Lab(开创了科学商业化的革命性方法,以改善人类生活)。公司现已拥有约 200 名优秀员工,他们均来自亚马逊、微软、软银机器人等知名科技企业,具备丰富的行业经验和专业技能。2024 年 11 月,前 CEO Geordie Rose 离职,目前由 James Wells 接替 CEO 一职,联合创始人Olivia Norton 担任 CTO 和 CPO,Philip Smith 担任 CFO。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

4.5 Agility Robotics: Digit加速量产 开启物流自动化新篇章

Agility Robotics 是专注于双足机器人开发的物流自动化先锋。Agility Robotics 成立于 2015 年,由卡内基梅隆大学的计算机领域专家 Jonathan Hurst和 Damion Shelton 联合创立,团队核心成员来自俄勒冈州立大学动态机器人实验室。该公司专注于开发双足人形机器人,致力于解决物流、仓储等场景中重复性高、劳动强度大的问题。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

4.6 Apptronik:谷歌参投 3.5 亿美元融资 Apollo 商业化加速落地

Apptronik 是一家备受资本青睐的人形机器人初创公司。Apptronik 成立于2016 年,由德克萨斯大学奥斯丁分校人本机器人实验室团队创立,致力于开发能够改变人民生活和工作方式的下一代机器人。Apptronik 开发了多种机器人相关的产品,包括外骨骼、人形躯干、双足移动平台和独特机械臂等,其中有些机械臂的负载量超过了自身重量。

人形机器人报告:海外人形机器人——特斯拉引领 迈向具身智能新纪元-有驾

4.7 小结

头部初创公司呈现“硬件百花齐放、大模型深度赋能”特征。Figure AI 推出全球首个人形 VLA 模型 Helix,实现双机器人协同作业,其训练数据利用率较传统模型提升 20 倍;第二代 Figure 02 通过定制 AI 模型强化人机交互,与宝马合作推进汽车产线应用,目标四年交付 10 万台。Boston Dynamics 完成液压向电驱技术转型,电驱版 Atlas 采用仿生肌腱结构,扭矩密度提升 40%,依托 Orbit™软件平台实现多机调度。1X Technologies 的 NEO Gamma 首创尼龙编织外壳与情感交互模块,结合 OpenAI 技术实现家庭场景长周期任务泛化;Sanctuary AI的 Phoenix 8 搭载 21 自由度液压灵巧手及新型触觉传感器,力控精度达 10 克级,已落地工业精密装配场景。

产业化落地呈现“物流主导、工业渗透、家庭探索”三级推进格局。Agility Robotics 建成全球首座人形机器人工厂 RoboFab,Digit 机器人通过 RaaS 模式在 GXO 仓库完成超万次订单搬运,年产能目标 1 万台;其第四代产品负载能力提升至 22.7kg,目标成本压缩至 2-3 美元/小时。Apptronik 与奔驰合作试点显示,Apollo 机器人将产线零部件配送效率提升 40%,获谷歌参投 3.5 亿美元加速量产进程。当前应用仍以标准化场景为主:物流领域聚焦货箱转运与 AMR 协同(Figure02 分拣效率达人工 1.8 倍),工业场景延伸至汽车装配线(宝马)、电子制造(捷普)等高精度领域,家庭服务处于功能验证阶段(1X NEO Gamma 厨房协作任务完成率突破 85%)。

资本驱动下行业估值中枢持续上移,美国领跑优势进一步巩固。Figure AI C轮融资估值达 400 亿美元(15 个月内增长 15 倍),Agility Robotics 投前估值17.5 亿美元,Apptronik A 轮融资规模居行业前列。技术路线呈现“分层架构主导、端到端突破”并行态势:Physical Intelligence 的 Hi Robot 模型通过VLM+VLA 分层设计提升指令跟随准确率 40%,而特斯拉端到端神经网络依托算力优势未来有望加速逼近人类运动水平。

0

全部评论 (0)

暂无评论