新闻中心

EEPW首页 > 机器人 > 业界动态 > 人形机器人为什么还是要看中国

人形机器人为什么还是要看中国

作者:龚正、郑思芳 时间:2022-11-09 来源:真故研究室 收藏

日前,Tesla Bot “Optimus”原型机在上海进行了全球首秀。

本文引用地址://www.cazqn.com/article/202211/440244.htm

身高 1.72 米,重 57kg 的它能搬砖、送货、浇花。马斯克说,它未来还能扮演猫女,且将带来“文明的根本转变”。

TeslaBot 在 10 月初特斯拉 2022 AI Day 上首亮相时,曾在科技界、投资界引发广泛回响。虽然有不同观点,但很多正在寻找未来增长点的人们选择相信。

我国把机器人作为国民经济发展的下一个重点。今年 4 月,《“十四五”机器人产业发展规划》印发,指出 2025 年我国要成为全球机器人技术创新策源地、高端制造集聚地和集成应用新高地。

在国内,包含在内、具备更广泛意义的足式机器人(包括双足、四足),已通过春晚、北京冬奥会等各种场合的表演与呈现,让大众有了一定的认知。腾讯、小米等大厂的入局,也让机器狗这类四足机器人有了走进大众的机会。

我国足式机器人产业到底发展到了哪个阶段,在全球处于一个怎样的位置,年轻人在这个产业中能有哪些发展机会?

我们对话了南方科技大学机械与能源工程系教授、博士生导师、鹏城学者特聘教授张巍。

人形机器人为什么还是要看中国


张巍教授的核心观点如下:

1、类比通讯电子行业,机器人行业还处于 BB 机、商务通等各类专机阶段;具有极强通用性的将是机器人界的 iPhone只是传信息的话,iPhone 的性价比远不如 BB 机,但当其可以支持多项功能之后,就会快速重塑整个行业。

2、通用机器人不一定需要通用才有商业价值。人形机器人真正进入千家万户,可能要十年左右时间。但产业化和商业化并不需要足式机器人实现通用能力之后才能开始,这个节点可能在未来两三年就可以实现。

3、研究足式机器人是难而伟大的一件事。伟大是因为它具有极大的颠覆性,手机是个人通讯娱乐的通用终端,智能汽车是未来人们在结构化道路上的通用终端,人形机器人将会是面向各类非结构化场景时连接数字世界与物理世界的通用终端。

4、要学好足式机器人必须打好数理基础并兼顾动手实践,两者缺一不可。这个新兴行业急缺优秀人才,对敢于面对挑战年轻人来说是个好时机。

以下为张巍教授对话实录:

Q1:您研究和进入足式机器人领域的契机是什么?

A1:很难说我从小就喜欢机器人,这是不现实的,对人形机器人抱有极大的兴趣也是最近几年才开始的事。

首先是对控制有深入的研究。我大概从 2005 年开始一直在做混杂动力学系统(离散事件与连续动力学耦合的系统)的控制与轨迹优化研究,后来随着深度学习的成熟,又涉及到这类系统的强化学习算法的研究。足式机器人系统随着离散触地事件会在不同动力学模型间切换,本质上是一类混杂系统,我前期在这方面的理论研究为后续的应用研究提供了极为重要的基础。

其次是足式机器人硬件近两年逐渐成熟,可以快速在硬件上实验验证算法并进行迭代,硬件的成熟对行业的发展极为重要。

对机器人的研究大概也就从五六年前开始,在此以前实验平台很稀缺,我们都是在打基础,因为这个行业对基础的要求很高,过去的研究并没有浪费,反而能够直接导入到后面的研究当中。

经过长期的研究和学习和技术背景的匹配,才有了深入足式机器人研究的契机。

Q2:足式机器人,是为解决人类哪些需求而生?

A2:整体而言,机器人主要解决两类需求:

第一个部分是解决移动需求,让机器人能够从 A 到 B 去做一件事,包括无人车、送餐机器人等都主要是解决了移动需求;

第二个部分是解决操作需求,让机器人在从 A 到 B 的每个场景上进行操作,比如在移动的基础上加一个机械臂来完成更多的任务。

这两个部分概括了 90% 的机器人能力。可以说,这两个需求,也是我们希望足式机器人能实现的需求。

Q3:一般大众会有个疑问,为什么一定要造有脚(无论是双足还是四足)的机器人?

A3:以前的机器人多以轮式机器人为主。在解决移动需求上,足式机器人与传统的轮式机器人存在较大差异,有更多优势。

首先,轮式机器人通过轮子转的方式来运动,平地上移动效率比较高;足式机器人则根据人的运动方式来走,地形适应能力更强,原理上能到任何人可以到达的地方。

其次,轮式机器人只能在为它构建的场景中使用,比如搭引桥、铺马路或者建轨道,轮式机器人很难去到野外、楼梯、台阶等这类不平坦、但却是人们生活中处处遇到的地方。

足式机器人能够弥补现有的轮式机器人不具备的地形适应能力,这对解决移动需求来讲是非常重要的。

就操作能力而言,腿足的机构又能为操作提供巨大的优势,这一点是经常被忽略的。



▲ 图 | 南方科技大学研发的 3D 点足式双足机器人

现在解决移动操作的办法一般是在轮式地盘上安装机械臂。所用的轮式底盘一般很重,移动时底盘又难以通过调整姿态来调节重心,一旦机械臂超过重心就难以保持平衡;同时由于底盘较大且姿态固定,轮式机器人的移动操作空间也相对有限。

足式机器人(尤其是人形双足机器人)与人的自由度则相对一致,在狭小的空间内能够完成轮式底盘 + 机械臂不能完成的操作任务。

比如人形足式机器人能够像人一样弯腰捡东西,或者取对面桌子上的一个东西时还能翘个脚来保持平衡。可以说,在技术完全成熟的情况下,这种形态的机器人能够解决任何人类能解决的移动操作需求。

Q4:足式机器人是否会和人一样,能灵活面对各种场景,解决各类需求? 

A4:如果只是专注于某一类场景,那通常足式机器人不是最好的选择。那为什么还需要足式机器人呢?本质上是专机和通用的区别。

专机指在固定的场景中代替人去完成相应工作的机器。但问题在于,很多应用情况没法对应一个场景就设计一个具体的专机。

整个机器人发展的趋势,本质上是从专机到逐渐通用的过程。比如大部分自动化生产线可以认为是机器人,但人们更多的是称其为自动化装置而不是机器人,因为单一性太强。

后来随着需求的增加,每生产一个东西就换一套设备成本太高,引进工业机器人和协作机器人就成了必然,机械臂能够满足更多柔性制造的操作需求。

但是机械臂只能在固定位置上部署,这还是满足不了某些需求,人们于是就研究在移动底盘上加机械臂,也就是现在的复合机器人,不光有操作能力,还能同时具备移动操作的能力,能够从 A 到 B 去完成一个任务。这就是逐渐提升通用性的过程。

简单来说,如果要解决某一个单一任务,这个答案大部分情况下不是足式机器人;如果要解决多个任务,并且任务足够丰富的话,那答案就是足式机器人。

通用性是足式机器人最大的优点,你不需要为任何楼梯或者任何场景专门设计一个专机去完成任务,足式机器人本身就能完成多个任务。当未来这样的任务足够多而且机器人成本又足够低时,那足式机器人就具有非常大的价值。

Q5:这是否意味着,足式机器人不需要为他们造一个他们能走的环境?

A5:以前的设计理念以专机为中心,在大量、单一并且重复的需求之下,这个逻辑是适合的。火车本质上也是专机,前提是人们需要先铺个铁轨才能运行。

足式机器人要替代的不是这些需求。在各种各样、需求量又没那么多的情况下,需要机器人的通用性来完成原本需要人来完成的事情。要想替代人来完成任务就必须能够到人能到的地方,外形不需要长得像人,但必须跟人有一样的运动方式。

我们的这个世界是根据人的活动特点来构建的,包括台阶有多宽、门槛有多高、门框有多窄,这些都是根据人的身形来定制的。我们已经建立好了这个世界,如果为了引入机械化就得把整个世界都改造,那这就不是为人设计的,而是为机器人设计的。

不可否认两种思路都是有利的。但是在需求规模不大的情况下,人们不可能为机器人去改造整个环境,足式机器人的价值就体现在这了。

Q6:目前我国足立机器人处于一个怎样的发展阶段?与世界相比,我们是同步还是落后?

A6:从学界来讲,做足式机器人研究的还不多,并不是每个学校每个专业都能够有几十个老师来做这个事。

从整体水平来讲,最近几年提升不少,但跟国外(尤其是美国)还是有一定差距的。

2019 年,美国 MIT 开源了一套四足机器人的方案,包括硬件和软件。所有人的技术下限都提升到了同一个起跑线,大家开始能在短时间内做出一个机器狗,但是这个开源方案本质上还是学术论文程度的开源,并不是成熟产品方案的开源。所以大多机器狗基本上只能走两步或者翻个跟头,离解决真实落地需求还有较大的差距。

现在这个差距主要体现在软件算法能力上,国内硬件相对成熟,但功能性很少。所以你会看到,大部分应用仍然以表演性为主,提前固定编排好动作现场再进行回放动作,包括在一些盛大的场合进行表演的机器人。

如何定义水平高不高?就看机器人是基于实时的信息来做决策与控制,还是事先编排好的动作做回放。

现在我们国内根据实时感知信息来做动作的研究还处于初步阶段,即使放在全世界来看还没有几家公司有完全成熟的方案。包括像波士顿动力这样的公司,也是 2018 年后才让机器狗走进现实的场景中,演示比如上下楼梯、在工厂巡检等场景,然而至今也还没看到全天候在工厂能稳定运行的情况,所以技术应该还不是完全成熟的。

就像人闭眼走也能走,但这叫盲走,在开源的前提下,现在“盲走”的技术都基本在一个水平上。虽然各个研究团队还有一定的差距但都差不太多。当真正睁眼睛去走走,还要在楼梯等各种场景中都能感知到,然后根据感知的情况规划足要踩在哪、要施多少力,目前国内不少机器人公司是不具备成熟方案的,高校中的研究也相对比较少。


▲ 图 | LimX 正向下楼梯实时视觉反馈展示

Q7:我国发展足式机器人在产业和技术上的优势和短板有哪些?

A7:目前我们最大的挑战是技术短板,但和国外相比最终我们或还会是个赢家,优势如下:

第一是成本优势,由于成熟产业链与相对低的人工成本,足式机器人硬件成本上国内有巨大的优势。

第二是场景优势,机器人发展的整个产业链以及落地场景都能在中国找到。无论是 ToC 还是 ToB 的场景,国内的丰富度都是国外的几十上百倍。有的行业场景在国外甚至是不存在的,从这个规模来看国内是有巨大优势的。

技术短板主要是欠缺机器人算法方面的原始创新能力。机器人软件算法能力大体分成三层。

第一个是顶层的 AI 层,就是代替人去做决策。比如机器人现在应该干什么,环境中都有什么物体,应该去哪里,抓取什么物体等。好在最近自动驾驶火起来以后,类似这类 AI 能力在国内反而是有优势的。虽然现在技术也不是那么成熟,但是至少国内跟国际上还没有明显的劣势。这个领域还不完全算是机器人领域,我们要解决的是提供通用移动和操作平台。

其次是定位导航的能力。AI(或人)决策了机器人应该去哪里做什么,接下来足式机器人在移动过程中需要知道哪是 A,哪是 B 点,从 A 到 B 走得偏没偏,这属于定位导航能力。这跟无人车和无人机是相通的。这个目前来说已经不是很难,国内也有很多团队在这方面有出色的工作。

最后是运动控制算法能力,也就是如何完成从 A 到 B、从这个台阶走到那个台阶的运动。这件事怎么完成跟上层 AI 没关系,因为 AI 已经告诉你要从这个点到那个点了,这个过程中需要感知和控制结合的能力,实时感知周围的环境,并根据感知信息来实时控制二、三十个电机来完成需要的移动操作任务。

在这几个能力中,国内相对匮乏的还是基于实时感知的多关节的控制能力,这也是我们团队主打这个核心技术点的原因。


▲ 图 | LimX 基于视觉稳定连续上下钢制镂空楼梯

Q8:我国在足式机器人领域人才供给的量与质,处于一个怎样的水平?国内哪些院校在发展足式机器人方面具备较强的实力?

A8:有不少团队在做,近期也吸引了不少新的研究团队进入这个领域。总之大家进步还是很明显的,但大家的精力还需要聚焦。

目前除了我们南方科技大学外,还有浙江大学、北京理工大学、哈工大等这些代表性院校比较有实力。

Q9:您如何评价我国一些足式机器人公司的产品和背后的技术实力?

A9:个人觉得目前没有很好的落地,不少都是把机器狗当作玩具类的机器人买回去遛一遛或者拿来表演,这些本质上都是出于猎奇心态或娱乐行为,很难归类于机器人领域的落地。

国际上波士顿动力和 Anybotics 正在推进在工业巡检方面的落地,国内也出现了在工厂里巡检的例子,但目前大多还解决不了上下楼梯和复杂地形的问题,这样的话相比轮式机器人没有太多优势,大多还是出于猎奇心态和宣传、展示的需求。

人们对机器人的兴趣,来源于期待机器人在未来代替人完成任务,但这个期待目前没有被实现。

Q10:足式机器人的商业化是否要等到它变得全能后才能实现?

A10:我们希望能推动足式机器人真正落地,而且不光四足,我们也很重视人形双足机器人。在这一点上,我们和特斯拉的理念是一致的。

等到足够成熟和便宜以后,未来每个家庭都会有人形机器人。人形机器人是未来的手机,相当于机器人界的 iPhone ,只不过我们现在还处在大哥大和 BB 机的阶段。如果只是传信息,BB 机就够用了,还不需要 iPhone,就像是专机和通用机器人的区别。

有些公司会直接布局到 iPhone 的形态,比如 Agility Robotics,特斯拉和我们团队都会直接研发人形机器人。短时间内还比不上 BB 机的性价比,因为它还只能完成简单工作,如发个消息。

然而人形的商业化进程会是渐进式的,要做的就是先把形态固定好,之后再往上加类似于 App 的功能。

第一个 App 出现,我们可以取代 BB 机,之后再有两个、三个 App,渐渐能够取代打电话、发 Email 、记笔记、玩游戏等功能,等到这些功能足够多以后,iPhone 就可以取代其它专门的电子设备了。

当然这是简单的类比,总之,当人形机器人能完成多项任务后,他的商业拐点会出现,同时会迎来颠覆性的发展。最关键的是以后无论加多少 App 它的基本形态都不用变,可能出现以前无法想象的机器人界的互联网式的发展。

所以我的观点是,通用机器人不需要通用才有商业价值。这只是一个终极产品形态,我们只要不断地在上面加功能。第一个功能不够,它的性价比比不过专机,那就加第二个功能,逐渐地就比两个专机要划算。特斯拉也类似这种思路,与其左一个 BB 机,右一个大哥大,每个专机领域各干各的,不如发明一个最终形态的 iPhone。

当然一开始在 BB 机时代去做一个手机可能有点夸张了,看起来没有必要搞一个这么贵的事,但我们是最早迭代这个产品的人,当我们有了打电话、发 Email 、看视频这些功能以后,性价比超过了市面上的专机,我们行业就可以开始迅速发展了。在逐渐形成市场规模以后,市场反而就不再需要 BB 机这样的专机了。

划分机器人有不同的维度,在某个维度上我倾向于把机器人分为工具类的机器人,比如像汽车和飞机,这属于人的交通工具,机器人可以替代人去开车,但不会去代替车,因为这是人的工具;另一类就是代替人的机器人,以后这些是最有可能会被人形机器人或者是足式机器人所取代的。

像马斯克说未来的人形机器人会比汽车的规模更大,我们也是这么认为的。

以前市场上有顾虑,一是因为技术还不成熟。还有一个是成本太高,但是特斯拉发布会上说可以做到 2 万美金以下。虽然乍一听价格还是很贵,但是在一些商业场景和工业场景中已经足够。未来家里也不需要左一个扫地机器人,右一个炒菜机器人,一个形态就能够完成保姆的任务。

我觉得人形机器人要进入千家万户,可能要十年以上。但产业化和商业化并不需要足式机器人在实现超能之后才能开始,这个节点可能在未来两三年就可以实现,特斯拉的预测可能大家将信将疑,但我们根据自身的理解对这个方向以及它的商业化进程是非常笃定的。

我们的足式机器人现在处于什么状态呢?同另一个领域类比,大概是 2010 年左右的自动驾驶阶段。现在有真正的自动驾驶吗?也还没有真正地落地,但是自动驾驶的研究和商业探索已经延展了很多,甚至开始颠覆整个汽车行业。

所以商业节点也是一步步来的,功能也是逐渐增加的,市场规模也在逐渐打开。

Q11:未来足式机器人的发展空间是怎样的?

A11:整个机器人行业大体有两个发展的思路。第一个发展思路是专注于一个垂直领域,各种各样的专机一定是存在的,前提是这个领域规模足够大、场景足够专一。但在一些规模不大、需求特殊而且不值得专门设计专机的领域,他们的共性是都将成为足式(移动操作)机器人的应用场景。

Q12:足式机器人在未来有望成为家庭陪伴型的娱乐角色吗?

A12:现在足式机器人能满足一部分的陪伴需求,外形拟人或者长得可爱的机器人都有,但现在也不是特别成功,没有特别大规模地进到每一个家庭里,因为成本还比较高。

陪伴的价值在哪?这个市场怎么定义?现在还不是特别清晰。我觉得以后会有一个这个分支,但是现在市场和产品都不是很成熟,我觉得它更依赖于通用 AI 技术的发展,而不是通用机器人的发展。

Q13:足式机器人受到资本关注的原因是什么?您认为资本是否能有足够耐心,等待足式机器人的发展壮大?

A13:我们把这个定义成难而伟大的一件事。难是因为相比现有成熟应用的机器人,足式机器人的软硬件不仅需要巨大的创新才能实现功能,而且还需要把成本做到尽可能低;伟大是因为它的应用广度和对人类社会的影响具有极大的颠覆性。对这个赛道感兴趣的资本看中的应该就是这一点。

这种类型的资本一般是视野长远、长期关注前沿科技发展的投资机构,足式机器人正是具有足够的想象空间和绝对的颠覆性的领域。

尤其是今年可谓是人形机器人真正产业化的元年,亚马逊投资 1.5 亿美元支持 Agility Robotics 在物流场景落地,特斯拉对人形的巨大投入和 AI Day 的发布也让国内的投资人至少看到了人形机器人行业的可行性。同时马斯克对降低成本的预期和能力,也让我们看到了潜在的经济效益。所以整个资本现在对这个赛道是很关注的。

目前,国内像明势资本、峰瑞资本、昆仲资本等投资机构,都非常关注足式机器人。他们愿意陪科学家走这未来的十年,他们不期待能够立刻产生价值,在这一点上大家的理念是一致的。因为这个事是难而伟大的,如果不难,就不可能伟大,谁都能做到。

另外,也应该看到市场上大多数投资人还不了解这个新兴赛道。由于特斯拉的出现,他们对双足的关注度要远大于四足。其实这两类的核心技术对我们来讲是一样的,我们把它们都会定义成通用移动操作机器人。

Q14:您对对足式机器人行业有关注、可能未来有兴趣加入这一行业的年轻人有何建议?

A14:打好数理基础和动手实践,两者缺一不可。

国内也有很多人非常有动手的热情,做各种各样的机器人,但本质只是在一个技术层次上做各种重复性开发与集成,大部分学生深度的掌握还是不够的。

很多机器人行业主要依赖从业者工程经验与技术集成能力,然而足式机器人是一件难而伟大的事,不仅需要工程经验,还需要对基础理论的深入理解,其中包括机器人学、非线性控制、最优控制、优化理论与算法、多刚体动力学、机器学习、计算机视觉等。需要长时间的积累,急不来。

这个领域的发展和迭代也很快,三年前的技术与现在完全不同,但是只要深入理解,你就会发现底层的原理与逻辑是一样的。有基础原理的深入理解能力才能以不变应万变,粗浅了解技术是远远不够的。现在市场上足式机器人优秀人才相对匮乏,对敢于面对挑战年轻人来说是个好时机。



关键词: 人形机器人

评论


技术专区

关闭