人形机器人拥有聪慧的“大脑”、敏捷的“小脑”、灵活的“肢体”,是通用AI的理想载体,蕴藏着巨大的市场空间和发展机遇。在今年的机器人博览会上,共有27款人形机器人亮相,让观众感觉离未来又近了一步。
人形机器人发展还面临哪些挑战?未来它们有哪些终极应用场景?对此,新京报记者正常采访了北京邮电大学人工智能学院教授方斌,北京航空航天大学副教授、博士生导师陶永,北京具身智能机器人创新中心数据智能负责人李广宇。
8月22日,2024世界机器人大会机器人博览会,“天工”人形机器人被团团簇拥。新京报记者 李木易 摄
方斌表示,人形机器人在形态上仿人。一种原因是移动能力,像人下肢一样运动;另一方面是仿人手臂的灵巧操作能力。具身智能是机器人本体和人工智能结合形成的物理闭环系统。人形机器人是具身智能非常典型的应用。由于人工智能仅依靠数据和算力,所以迭代的速度比机器人本体更快一些。
李广宇介绍,人形机器人相当于是具身智能机器人的一个典型应用示范。首先在技术上是高地,如果把人形机器人的技术问题都解决的话,可以向下兼容别的类型的机器人,比如把腿换成轮式底盘,这就是现在比较流行的轮臂机器人。
在通用性上,世界上大部分的设计都是以人为核心用户,所以做人形机器人在细分场景的效率不一定最高,但泛化性和通用性是最好的。从伦理的角度来说,人形机器人更能和人产生情感的共鸣。
陶永介绍,人形机器人拥有聪慧的“大脑”、敏捷的“小脑”、灵活的“肢体”。“大脑”作为人形机器人控制管理系统的中心,承担着类似于人类大脑的复杂认知和决策功能。基于通用大模型、数据集、高效计算架构、多模态融合感知等关键技术,“大脑”使人形机器人具备了学习与适应能力,使其可处理基本运算、图像处理、视觉识别、决策规划和智能决策。
“小脑”在人形机器人运动控制与协调方面发挥及其重要的作用,是实现精确动作的保证。“小脑”由传感器融合模块、动力学模型和控制器等组成,制定运动策略,确保机器人动作的流畅性和稳定性。
陶永表示,特斯拉等公司研发的人形机器人向大众展示了它的潜力,引起了关注。人形机器人搭建了一个通用的平台,可以将AI、大模型技术迁移到人形机器人上做验证,比如将汽车上基于视觉的环境识别、避障运动、路径规划的功能迁移到机器人上后,将发挥更大的优势。
在相关领军企业的推动下,人形机器人的技术正在加速迭代、快速研发,硬件成本不断降低,有望更广泛地出现在检测、搬运等场景中。
李广宇认为,这很大程度上归功于大模型发展突飞猛进,特别是过去两三年,从ChatGPT的发布到最近多模态大模型的进展,都远远超出业界预期,已经走向公众视野。但大模型毕竟是在软件层面,和现实的物理世界缺少交互媒介,所以业界希望给通用的人工智能加一个身体,也就是具身智能。
另外,这也归功于国内多年来产业链的发展,包括传感器技术、电机技术等,使人形机器人研发门槛降低。同时,国家在政策引导方面对人形机器人产业给予了较大支持。
陶永认为,人形机器人能适应复杂地形,比如在电力巡检过程中,轮式机器人迈不过去的台阶,人形机器人能上得去。另外,人形机器人上肢有更多自由度,可以实施精确操作。
李广宇表示,工业机器人重复定位精度非常高,但没有泛化性,基本按照编程重复进行。人形机器人既有移动能力,也有操作能力,其泛化性带来了通用能力的预期,在物料分拣、上下货等环节可以对工业机器人进行补位。
人形机器人不仅使用了计算芯片、存储芯片、控制芯片、触觉传感器,还应用了各类软件、各类关节、伺服电机、人造皮肤等新材料。
方斌说,目前,经过人形机器人这波热潮,小型化的电机、驱控一体化的关节相对成熟了不少。受限的在于关键的传感器件,包括类似于人皮肤的触觉传感器,类似人手的灵巧手操作末端,和人类相比还欠缺很多。比如在手机装配线上,工人可以熟练地进行精细的工业装配,但人形机器人还完成不了这些任务。
陶永也表示,从硬件上来说,高能量密度小体积的关节、低成本的传感器等仍需提升。软件方面,要实现人形机器人在草地、沙地、崎岖路面的稳定行走,目前有基于步态的虚拟仿真训练平台进展较快,但仍然要一直完善。
他说,目前人形机器人价格偏高,未来,随着硬件价格和软件研发成本降低,应用场景日渐成熟,人形机器人有望批量化生产,价格下降。
李广宇表示,“大脑”部分得益于大模型的发展,比“小脑”和“本体(肢体)”更成熟一点,主要负责人机交互和日常任务的规划拆解。“小脑”负责具体执行,目前业内正在尝试不同技术路线的方向,还需要一定的探索。
“本体(肢体)”包括上肢、下肢和传感器三个方面。在上肢方面,多关节、多自由度的机械臂发展得相对成熟,但上肢末端灵巧手的精细操作需要快速迭代。通过近些年四足机器人的发展,下肢研发的进展比较快。传感器方面,视觉传感器很成熟,末端的触觉传感器在不断迭代当中。未来,人形机器人将走多模态传感器融合的路线,所以不一样的种类的传感器都需快速发展。
方斌说,人形机器人整体运动的敏捷性仍有所欠缺,在通用场景下执行任务的操作能力有待提升。AI和本体的系统集成能力还要进一步发展。
要增加人形机器人运动的感知能力,通过深度强化学习增加抗干扰性,使AI算法和机器人本体的结构控制耦合得更紧密。
李广宇表示,具身智能的数据比较稀缺,是制约产业高质量发展的一个重要的条件。目前,北京具身智能机器人创新中心正牵头建设人形机器人世界上顶级规模、信息最稠密、最通用的高质量具身智能数据集。为推动行业加快发展,创新中心还公布了“百台天工计划”,将向重点科研机构与高校提供超百台“天工”系列机器人,共同探索机器人在各种细分场景中怎么样更好落地。
陶永认为,人形机器人正处于核心技术快速突破阶段。在未来10年里,人形机器人有望在恶劣和特殊环境下,代替人类进行值守、巡逻和作业。同时,在关键技术突破的情况下,人形机器人可能在智能工厂进行巡检、加工、检测。另外,它们或将应用在教育中,在大学中成为实验平台。在更远的未来,人形机器人也有一定的可能进入公共场所或者家庭,进行陪护。
方斌认为,人形机器人作为通用的具身智能本体,未来就像人类职业分工一样,能应用于不同场景,有的做医生,有的当厨师,有的在生产线上做工人,有的做家政护理等。在家庭应用方面,由于老人、儿童对人形机器人的安全性要求更高,它有可能率先在中青年家庭中应用清洁打扫功能。
陶永说,这一场景还比较遥远,比如仿生机器人手眼协同能力还要提升,做饭、叠衣服、装配零件,这些日常操作对人来说很容易,但对机器人来说,涉及视觉、手臂末端触觉力、运动控制协调等,都要仿人的智能化程度来实现,中间有很多关键技术需要突破。
比如仿生人形机器人的面部表情,如果做不好会给人带来恐怖的感觉,电子皮肤也要像人类皮肤一样有感知、交互功能,这些都需要一点点攻克。未来,仿生人形机器人有望在展览、科普场馆中率先使用。