央视网消息:党的二十届三中全会中精确指出:加强新领域新赛道制度供给,建立未来产业投入增长机制。什么是“未来产业”呢?它是指由前沿技术驱动,当前处于孕育萌发阶段或产业化初期,具有非常明显战略性、引领性、颠覆性和不确定性的前瞻性新兴产业。
2024年被称为人形机器人商业化元年。据首届中国人形机器人产业大会发布的报告预测,2024年中国人形机器人市场规模将达到27.6亿元,2030年有望成长为千亿元市场。在八月底北京举办的世界机器人大会上,有27款来自国内外的整机人形机器人亮相。
2024年,人形机器人进化到了什么程度?人形机器人离真正进入我们的生活还有多远?
写毛笔字、打咏春拳、弹扬琴、泡工夫茶,琴棋书画,十八般武艺,无所不能。上得了厅堂,下得了库房,搬得了重物,还能走进工厂。机器人有超越人类的大脑,可以秒变行业专家。
他们也可以有和人一样的皮肤、表情,喜怒哀乐随时表达。机器人能像人类一样,行走、奔跑,克服地形障碍,它还可以比人更灵活,360度转身,翻腾、卷腹站立,扛住击打。随着AI算法、核心零部件、智能制造等技术的持续不断的发展,人行机器人将逐步走入人们的生活。
人形机器人是一个技术高度集成的产业,从所有的环节的单点突破到整机的系统化迭代,可以说每一步都充满挑战。比如,在不依靠提前建模或编程的情况下,如何让机器人“自己”学会在各种地形上稳定行走就非常不简单。
这是首个登上长城的人形机器人,在凹凸不平的城砖上,实现了自主行走。机器人的自主行走并不像看起来那么轻松,尤其是在不同地面,不同的环境中,能适应多种地形。
总台央视记者 张春玲:我身旁的这个多面手机器人名叫小星,它是全球首个实现了AI驱动无编程算法,率先实现可以在各种地面行走的人形机器人。
北京星动纪元科技有限公司创始人 陈建宇:我们目前的小星是用全AI数据驱动的方法,没有一点的提前的建模或者是编程。我们在仿真里面模拟出来了,千奇百怪各种各样的可能复杂的环境和地形,然后让它训练在这样所有的环境里面,都能够很稳定地去行走。
在虚拟世界的不断训练为小星提供了丰富的行走经验,但让它在外力面前保持稳定,还需要算法的提升。团队设计了全球首个去噪世界模型。让机器人在仿真训练基础上,可以预测并提取环境的关键信息,减少真实世界对机器人本体任务的干扰,他们还自主研发了机器人的核心关节和零部件,帮助他更好行走。
陈建宇:我们是完全自主地研发了具备高功率密度的这样一套关节电机,我们使得它能够同时具备很高的力量。它能够支撑起很重的身体,甚至它能够在负重上100千克,大概200多斤的情况下,也可以有效的进行深蹲。同时它还能够具备很高的速度,所以说我们能看到,在遇到一些干扰或者不确定,或者打滑的情况下,它的腿能非常迅速地做调整和迈步。
人形机器人的迭代涉及许多核心部件的突破,比如一双能像人类一样可以感知真实世界的灵巧手,或者一个会做各种表情、可以惟妙惟肖表达各种人类情绪的机器人脸。这里面每一个环节的创新突破,其实都是复杂而精密的,戳视频↓我们大家一起去看一个叫小胡的仿生机器人,它的特点是:不仅有自己的“个性”,表情还特别丰富。
您现在看到的这个机器人,是一款由我国创业团队自主研发的仿生机器人,它可以实时地通过视觉分析和动作模拟,完成对人类表情的精准复刻。
松研动力(北京)科技有限公司创始人 张世璞:在硬件层面上,我们在他的头部集成了三十多个机械的自由度,它能够呈现出来很丰富的表情,我们在算法上用AI和大模型所融合的一个技术,能够让机器人理解人类的语言,它就能够体现出来自己的人格和性格。
丰富的表情,能够让人类看到它细腻的情绪表达。而一双灵巧的双手,让它能更丰富地理解世界。
您现在看到的是一双国产自主设计的灵巧手,它们像人类的手部肌肉一样敏感,在极小的面积上集合了数百个触觉感知单元,可以感知到压力、物体的摩擦力、温度、材质等,也能感知到力的方向。现在记者手中按压的就是一个布满传感器的小巧指尖,经过力学、几何学等3D触觉阵列数据的分析,能够实时灵敏地反馈出操作的力度和按压面积的大小。
帕西尼感知科技 首席技术官 张恒第:人的手上有一种细胞它是可以感知到200到400赫兹左右的震动,我们的机器人把这样一个频率提到1000赫兹左右,说明我们的传感器实际上它采样率以及所有的数据量,是可以大于我们人类的一个水平的。
复杂的传感器设计与AI算法相结合,灵敏的“机器手”可以像一个老裁缝一样,通过触摸判断出不同面料的材质,同时在力控方面,它可以感受到羽毛拂过,又能承受5公斤超高负载,收放自如。触觉与机器人视觉相融合设计的视触觉机器人,可以更轻松地判断与执行各类任务。
帕西尼感知科技联合发起人 聂相如:这是我们一个瓶身的抓取演示,像你们可以看到这只瓶子是空的,另一只瓶子我们装了些水,在机器人它拥有过触觉传感器之后,它可以对我们的瓶身以及瓶子的重量,各种维度的这一些信息赋予它一个感知能力。那它拥有这些感知能力之后,它就可以轻轻松松完成对一些目标物的成功夹持。
触觉,是一种非常难以被量化的感知能力,触觉传感器作为机器人产业高质量发展的关键零部件,是一个高度集成的卡脖子技术。这个以90后为主的初创团队在一个指尖实现了技术突破,目前他们的传感器已经服务国内30多家人机一体化智能系统头部企业,同时远销欧美市场。
聂相如:我们的使命希望是为更多的行业,为尤其是我们现在国家全力发展的人形机器人行业,去提供一个更好的技术赋能。
有专家预测,人工智能的下一个风口就是“具身智能”,它是指将人工智能融入机器人等物理实体,赋予它们感知、学习和与环境动态交互的能力。人形机器人就是这样一个软硬件精密结合的载体。我们大家可以想象一下,若机器人不依靠事先的编程,而是拥有自主的学习、感知、判断以及反应能力,未来在我们的生活中会有哪些应用场景呢?
您现在所看到的机器人刮胡子的视频,全部是由机器臂自主规划并完成的。手脚麻利、力度适中,又没有死角,不仅是刮胡子,叠衣服、削黄瓜,这些精细活现在全都能靠机器人来实现。这些极为精细和柔性的机器人操作,背后的核心,是具身智能大模型。
上海交大人工智能学院教授 卢策吾:语言模型是文本进文本出,我们是机器的操作进去,然后机器的操作出来,或者更直接一点是视觉的进去,然后机器的操作出来,我们应该做到决策层面的,那么面临的难度是跟语言模型它面临的难度是完全不一样的。
机器人具身智能,需要大量数据来进行训练。上海交大卢策吾团队一方面,创新搭建了一个以真实世界物理原理为基础的世界模型仿真数据库,让机器人在虚拟世界与各类场景进行学习和交互;
另一方面,他们还通过自主研发的便携式模仿学习装备,让机器人跟随模仿人类的动作,进行一对一的学习。
上海交通大学计算机科学与工程系博士生 方鸿杰:这套外骨骼是我们创新自研的机械臂数据采集装置,我们同时会采集图像、机械臂的轨迹信息,以及力和力矩等多种数据,这一些数据将被用于后续“穹彻”具身大脑的力位混合大模型的训练。
现在,我们只需要给机器人一段文字、语音或者动作等指令,机器人就可以自动化地达成目标。为了更精准执行任务,团队又构建了全球唯一的具有力反馈的数据采集平台,创新地设计了力位混合算法,让机器人在力和位置控制等方面做精准计算。
您看这个盘子里均匀晃动的球,就为我们展示出了机器人超强的动作控制能力。如今卢策吾团队通过成果转化将具身智能大脑快速赋能机器人本体,已经应用在了汽车、数码产品、航空、科研等多个领域。
工信部、科技部等七部门在2024年发布的未来产业十大标志性产品中,第一个就是人形机器人。推动人形机器人产业化,国家和地方多个层面都在整合资源和加紧布局。
粤港澳大湾区是目前世界人形机器人供应链的重要集聚区。据统计,全球人形机器人约38%的供应链企业在中国,而中国约57%的供应链企业就在大湾区。
在北京的亦庄,已有二十多个以机器人和人机一体化智能系统为特色的产业园区,同时,目标规模100亿元的北京机器人产业高质量发展投资基金已经成立。
此外,目前在北京、上海、广东、浙江、四川等地都成立了具身智能机器人创新中心,攻关关键核心技术,打造公共服务平台。