四足动物|新算法让机器人媲美四足动物


四足动物|新算法让机器人媲美四足动物
文章图片
机器人“绝影”实现了可与四足动物相比拟的运动技能 。李智彬供图
一只狗或者一只猫从来不用经过太多思考,就能依靠本能适应自然界的变化,在复杂地形中上蹿下跳,灵活运动 。但这一点对于同样具有四足的智能机器人来说却并不容易 。如何让机器人向自然界的动物看齐,是全球机器人专家们长期探索的课题 。
近日,英国爱丁堡大学先进智能机器人实验室与浙江大学朱秋国教授的机器人团队合作,完成了一项针对四足机器人的新算法研究 。这项研究成果被选为《科学—机器人》杂志的月度封面论文 。
构建多专家学习体系结构
爱丁堡大学信息学院助理教授李智彬主导这一中英合作研究,也是论文的通讯作者 。在接受《中国科学报》采访时,他先解释了传统算法与论文中描述的新算法之间的区别 。
在传统方法中,算法工程师们往往只依据某个具体的人或物编程,这就意味着如果机器人遇到没有被编入程序的场景,就非常难以应对 。比如,在参与野外救援时,周遭环境复杂,让机器人难以应付;或者有些机器人只是单项技能被训练得十分得心应手,但无法自如实现模式转换,“这也让其实用性大打折扣” 。
为了实现多功能运动,机器人需要适应前所未见的场景下的运动技能,为此该研究团队提出了一种多专家学习体系结构(Multi-Expert Learning Architecture,缩写为MELA) 。“我们将原先单一技能的神经网络群通过一个层级架构组合在一起,通过在线的动态激活来实现多种技能的动态融合 。目前,在MELA上共设有8个深度神经网络(DNN),由团队中每个领域的专家分别负责一种特定的类型技能 。”李智彬介绍道 。此外,整个架构当中还有一个门控网络程序,负责动态地调度整个神经网络群 。也就是在不同情况下,选择性地、不同程度地激活各个DNN 。如果遇到特殊情况,则会让多个网络共同配合以解决当前任务 。
“就好像是足球队中有多位运动员,各司其职 。踢球时,每个运动员每时每刻所做的动作和参与程度不同,门控网络就好比教练,告诉哪个运动员在哪个时间应该去做什么 。”李智彬打了个比方 。
在运行时,MELA不断混合多个DNN,并动态合成新的DNN,以响应不断变化的情况而产生自适应行为 。李智彬表示,这种方法利用了受过训练的专家技能和自适应策略的快速在线综合的优势,可以在不断变化的任务中迅速响应 。“使用一个统一的MELA框架,我们在一个真正的四足机器人上成功演示了多项技能运动 。该四足机器人完全自主地实现了连贯的小跑、转向和跌倒恢复,并展示了多专家学习生成行为的优点 。这些行为可以适应之前无法预料的情况 。”
实现可比拟四足动物的运动技能
在这项研究中,研究人员使用的四足机器人,即是被称为中国版波士顿动力的 “绝影” 机器人 。基于MELA深度学习框架,研究人员在真实机器人身上成功实现了可比拟四足动物的运动技能 。
【四足动物|新算法让机器人媲美四足动物】除此之外,李智彬表示,从生物学的角度来看,研究人员借鉴了生物学中的“层级架构”的运动控制方式,将“中枢神经系统的上层运动控制指令”与“脊柱神经系统、肌肉本身控制”作为相对独立的层级,让两者分而治之,提高了学习的效率和速度;同时,从机器学习的角度来讲,MELA深度学习构架使得各种运动技能可以通过“自动软件流程+算力”来获得,而整个过程中只需一个研究人员参与即可,无需一个多人团队 。从长期来看,这种机器智能是大势所趋 。

推荐阅读