半岛观察丨“人机共舞”解锁未来!青岛加速布局当下最火产业赛道
5月14日,2025青岛市具身智能机器人生态发展大会在青岛国际会议中心举办,这是青岛第一次以“具身智能”的名义召开全市规模的大会。
围绕机器人的投资正在升温。北京、上海、深圳等10多个地方政府已建立十亿元以上规模的产业基金。5月14日,青岛市具身智能机器人产业基金战略合作框架协议签署,目标规模达100亿元,将为青岛具身智能产业发展提供强劲支撑。
如今,为什么机器人的发展会突然加速?
机器人今年频频吸睛
此前的蛇年春晚上,10多台宇树机器人身着花棉袄登上舞台,与真人舞者一起扭秧歌、转手绢,引起广泛关注。人们惊呼,人形机器人来到普通人生活了。
青岛市具身智能机器人生态发展大会以“‘机’聚新动能 ‘智’创新未来”为主题,旨在推动人工智能与机器人技术深度融合,加速青岛具身智能机器人创新发展和示范应用。当下,人工智能发展前景广阔,青岛市委、市政府顶格谋划“10+1”创新型产业体系,把人工智能作为优先发展的先导产业之一,聚力突破人形机器人等细分赛道,努力打造北方地区具身智能机器人产业创新高地和重要的研发制造中心。
从春节至今的两个多月里,社交媒体上隔三差五就会出现人形机器人的爆款视频,展示前空翻、后空翻、骑自行车等绝技,以高难度动作和拟人化互动刷新人们对具身智能的认知。
具身智能,是近年进入公众视野的新词汇。它强调智能系统与身体的紧密结合,通过身体与环境的交互来实现智能行为。与其区别的概念是无身体的智能,比如,没有物理身体、完全依赖于计算和数据处理来实现智能行为的聊天机器人。
具身智能、智能机器人、人形机器人关系示意图(图源:中国电子报)
人形机器人是具身智能的典型应用形态之一。今年全国两会上,政府工作报告明确将建立未来产业投入增长机制,培育包括具身智能在内的未来产业。
一些工厂、大学、科研机构、人工智能公司等正在率先使用人形机器人。
4月19日,北京亦庄半程马拉松暨全球首个人形机器人半程马拉松引起全球关注。20支参赛队伍中共有六支参赛队伍完赛,其中,来自北京人形机器人创新中心的天工用时2小时40分42秒成功夺冠。
除了进入工厂、大学、科研领域外,还有人形机器人在进入特种行业。比如,南方电网广东电网公司牵头研发的电力特种人形机器人,可承受零下40℃极寒和80℃高温,已投入应用,在深山老林精准查找故障点。
全国多地围绕人形机器人的产业布局在加速。据了解,目前北京、上海、深圳、重庆等10余个地方政府已建立和筹备建立产业基金,重点投向机器人本体、产业链零部件、产业链创新应用等领域。北京、深圳有10余家企业发布人形机器人产品,上海、杭州、广州等地企业也竞相发布。
2025年1月8日,在美国拉斯维加斯消费电子展上,人们在宇树科技展区观看机器人展示。新华社发
在投资界,机器人公司热度日益升温。据创业投资和新兴科技行业数据服务商IT桔子数据显示,今年前3个月,具身智能赛道的50多家企业获得超60亿元融资。
加速因何而起?
1973年,日本早稻田大学推出世界第一款全尺寸人形机器人WABOT-1,浑身缠满电线,每走一步需要45秒,每次只能走10厘米,笨重缓慢。
本世纪初,日本本田公司发布一款酷似太空宇航员的人形机器人ASIMO(阿西莫),能上下楼梯,听懂语音指令。2013年美国波士顿动力公司发布的人形机器人Atlas在跑步机上健步如飞,还能跳跃、旋转、翻滚等,它为灾难现场而设计,目标是在化学泄漏、建筑倒塌等危险区域替代人类完成开关阀门、搬运等任务。
尽管在技术上取得显著进步,但2018年日本本田公司宣布停止对ASIMO机器人的开发。波士顿动力公司的Atlas机器人虽然运动控制等能力广受好评,但由于价格高、维护困难等限制其实际应用,波士顿动力公司则被多次转卖。
2007年10月22日,在位于日本东京的国立科学博物馆,本田公司的机器人“阿西莫”为客人端送饮品。
此后,人形机器人行业一度陷入沉寂。直到近年来,人形机器人突然加速发展。为什么?
“长期以来机器人开发以编程为基础,2022年AI大模型问世,能模拟人类的大脑,具有泛化迁移等能力,推动人形机器人这一新物种的发展。”北京航空航天大学机器人研究所名誉所长王田苗解释到。上世纪90年代,他研制出第一代医疗机器人。
浙江人形机器人创新中心主任、浙江大学教授熊蓉表示,传统机器人研究范式依赖于对人类运动肌理的数学建模,并通过寻求最优解来实现功能。这种方式高度依赖人类专家的经验,存在泛化能力不足的局限性,难以实现举一反三的智能。
“我们过去应用人工智能技术时,主要集中于感知层面的功能开发,如语音交互和视觉识别,这使得机器人只能执行预设程序的特定任务。”熊蓉指出,“随着新一代人工智能技术的发展,我们现在可以通过大规模数据采集和神经网络训练,让机器人掌握更多隐性知识,这为研究开辟了新路径。”
人工智能赋能机器人,也是产业界的共识。
在沈阳新松机器人自动化股份有限公司总裁张进看来,近来对人形机器人推动最大的力量,就是新一代人工智能。他上世纪90年代初进入中国科学院沈阳自动化所,专注于机器人研发,企业在行业中率先上市。
张进说,他们公司也曾尝试搞人形机器人,行走、肢体动作等不是技术难点,最大问题是造出的人形机器人没有“大脑”。
专家观点用通俗的话解释就是,此前的人形机器人像一个“提线木偶”,依赖“预先编好的程序”或单一功能的AI,应用场景受限,而大模型的出现让机器人加速增长智慧,开始真正读懂环境,自主决策交互,打开了应用的广泛空间。
多名受访专家提到2022年发生的一件事:特斯拉正式发布人形机器人Optimus(擎天柱)。马斯克展示了擎天柱在汽车工厂搬运箱子、抓取金属棒的视频,并表示将规模化生产,成本可降到2万美元至3万美元间。
2022年11月5日,在第五届进博会汽车展区拍摄的特斯拉人形机器人。新华社发
“擎天柱接到指令后,不是按传统的编程执行,也没有固定的运动轨迹,它能理解指令,自主决策,分解为多个动作实现,这就把机器人的应用上升到一个高度,让大家看到人形机器人的发展方向。”张进说。
清华大学自动化系机器人控制实验室主任赵明国说,他2001年开始研究人形机器人,一直头疼的问题是机器人太贵,减速器、驱动器、电机等硬件成本高。特斯拉入局后,以做产品和建产业链的方式,把原来车厂的供应商带进机器人领域,给行业带来全新思路。
人形机器人一般由大脑、小脑、本体三部分构成。它的研发有哪些挑战?
以让人形机器人接一杯水为例——
“大脑”把这一指令拆解为“杯子是什么?握杯子哪个位置?水在哪儿?怎么去?接多少水?冷还是热?”等多层级任务。这一过程中,“大脑”有大量识别、感知、判断、决策等计算,任何一环有疏漏,都会让指令失败。
而走、拿、倒、递等具体动作,包括如何绕开一个挡路的凳子或抬脚迈过厨房门槛,则依靠“小脑”指挥。移动过程中,若突然出现了宠物,还要将信息反馈给“大脑”重新规划路径。
今年以来亮相的一些产品,正是体现了“小脑”“大脑”等技术的进步。
春晚宇树机器人的表演,被多名业内人士认为“小脑发达”,展示了很高的运动控制水平。因为“小脑”的特点是,其算法高度依赖围绕机器人硬件采集的数据,对与硬件之间的适配度有较高要求。
3月,北京人形机器人创新中心发布全球首个“一脑多能”“一脑多机”的通用具身智能平台“慧思开物”。
“具身智能在智能化方面仍处于初级阶段,行业亟需一个具备多本体兼容性、多场景适应性和强大泛化能力的通用智能平台。”创新中心总经理熊友军说,“慧思开物”就是为了替具身智能产业补上通用软件系统这块重要拼图,助力人形机器人从执行单一任务向在复杂环境下自主决策和执行任务迈进。
当下,限制人形机器人发展最大的瓶颈仍是“大脑”。业界普遍认为,关于通用具身智能大模型这个被称为机器人“大脑”的研究才刚刚开始。
国内一公司研发的厨房机器人助手
哈尔滨工业大学计算学部副主任、人工智能学院执行院长张伟男及其所在团队长期从事机器脑研究。他说,国内外在机器人“大脑”方面,还未有像大模型那样突破性的产品出现。
“从智能化的核心,即大脑的软件部分来说,目前面临的最大问题是数据,面向跨场景的高质量、大规模数据比较缺失。”张伟男说。
最近,人形机器人端茶倒水、在葡萄上穿针等视频在社交媒体广泛传播,不少人由此认为:很快可以买一台机器人当保姆了。
当记者把“人形机器人什么时候能进入家庭”的问题提给多名业界专家时,他们的态度普遍谨慎,表示人形机器人能做一些复杂的动作,并不意味着它们能进入家庭,能动与能做之间还有巨大的鸿沟。
“具身智能爆发性成长依赖于软件大模型、数据合成训练、芯片算力等。”王田苗说,大模型最初通过问问题把自己训练成“文科生”,再通过学计算、分析、推理,训练自己成“理科生”,接下来大模型要训练自己成为“工科生”,要有知识、懂技能、会操作,并且和人协作。他估计两三年后会出现具身智能的各种应用,2035年以后人形机器人可能成为主角。
“人形机器人目前要进入家庭场景还很困难。”熊蓉认为,3到5年可能在一些特定场景开始落地,要具备通用性则需要7到10年。
北京钢铁侠科技有限公司创始人张锐的团队,2025年入选参与中国宇航员人形机器人项目。他坦言:“相比进太空,人形机器人要进家庭完成任务,难度会更高,周期会更长。”
张锐解释说,家是一个复杂的环境,有老人、小孩和猫狗,地面有地毯、地板、地砖、水泥等,平整度不一样,人形机器人走在不同地面摩擦力不一样,有倾倒风险。一块100多斤的钢铁,无论砸到人还是宠物,都是伤害。“从这个角度看,进入家庭的人形机器人,不能是现有机械、电子结构的堆叠,而要以新材料通过化学变化形成新一代的肌肉、骨骼等。”
对未来的憧憬与警惕
人形机器人会在哪些领域率先应用?
工信部指导意见提出三方面场景:服务特种领域需求;打造制造业典型场景;加快民生及重点行业推广。
专家表示,一些条件恶劣、场景危险的作业,比如民爆、救援等,就需要人形机器人,可以降低工作危险性。
虽然汽车、3C等制造业是提升人形机器人工具操作与任务执行能力的重要场景,但目前国内外进厂实训的人形机器人,承担的仍是简单任务,效率均不及一般工人。
例如,美国Agility Robotics公司负责人表示,工厂中的搬运是人形机器人最匹配的应用场景,其机器人Digit目前的电池只能支持连续工作1.5小时,之后要充电1.5小时,这决定目前人形机器人工作效率远低于工人。
业界人士普遍认为,人形机器人未来要进入更广泛的真实应用,必须先进入“职业技能培训学校”。
上海智元机器人的数据采集中心就是这样一所学校。约4000平方米的空间里,搭建餐厅、奶茶店、家居等日常生活场景,上百名数据采集员头戴VR眼镜、手持操作手柄,“手把手”教机器人做家务——叠衣服、收拾碗筷、倒茶、送餐、清理桌子、超市收银……每个动作需要机器人重复数百次。
2025年2月18日,在智元新创技术有限公司数据采集中心,数据采集员“教”机器人学习各种技能。
比如,在人类眼中极其简单的倒水这件事,机器人只有从高质量数据中才会理解,往杯子A里倒还是往杯子B里倒,杯子被临时移动位置时如何从容应对,而不是成为捣乱或摆烂的“智障”。
智元联合创始人彭志辉解释说,与大语言模型需要的文字、图片、视频等数据不同,机器人需要去三维世界跟有形物体进行交互,这种数据不可能从互联网获取,只能通过大量投入人力物力,采集海量真实的机器人交互数据。智元研发团队有超过一半的人都是在做“大小脑”相关的研究,虽然难但必须突破。
除了智元这样机器人公司开设的训练场,北京、上海的国家地方共建人形机器人创新中心也建立起人形机器人“技校”。
不过,虽然未来人形机器人会给人类工作和生活带来极大便利,但也可能给原有社会秩序带来挑战,产生伦理等方面的风险。专家警示这不仅关乎技术和商业,更事关人类的未来。
人们会担心机器人不知何时会失控,人类的权利在不知不觉中被侵犯,还担忧机器人的行为无法追溯和问责。
中国工程院院士、机器人与工业自动化专家王天然认为,这些问题的解决方式直接决定了公众对于机器人及其技术的接受程度。因此如何对机器人的行为加以约束,如何引导机器人的行为和公共决策能够符合人类的基本价值观,应该成为机器人设计者、生产者、应用者乃至社会管理者都关注的问题。
早在80多年前,科幻小说家艾萨克·阿西莫夫提出“机器人三原则”,探讨机器人与人的关系:机器人不得伤害人类,或坐视人类受到伤害;机器人必须服从人类的命令,除非该命令与第一原则冲突;机器人在不违反第一、第二原则的情况下,必须保护自己。
人形机器人代表的不只是技术突破,也将对人类自我认知产生深刻影响。
这场人机共舞才刚刚开始,它的舞步将关乎文明未来的律动。
(半岛全媒体记者 徐晓 李存国 综合整理)