所有文章 > 正文

清华大学孙富春教授:基于知识智能的机器人技能学习

作者: 学术通

时间: 2019-12-05 10:11

在2019中国人工智能产业年会分论坛——“知识智能及其产业应用论坛”上,清华大学计算机科学与技术系教授、中国人工智能学会副理事长、国家杰青孙富春教授发表了题为《基于知识智能的机器人技能学习》的报告。

99981.jpg

孙富春教授

报告聚焦人工智能的热点领域“机器人”,并从五个部分进行了讲解,分别为:脑启发的行为智能、基于经验的灵巧操作、知识和数据结合的灵巧操作、团队的主要工作、未来展望。其中,重点讨论了操作示范与技能传授、灵巧操作技能的运动规划与协调控制、操作技能的多层次知识化表达、操作数据/知识库和基于知识智能的多任务操作技能迁移学习与技能增强,以及机器人灵巧操作的未来发展。

99982.jpg

孙富春教授PPT

针对第一部分“脑启发的人工智能”,孙教授首先从人的灵巧操作讲起:“人操作为什么越来越灵巧呢?一是人的大脑变得越来越大了。390万年前,大脑最初只有350克。到了公元前70万年到20万年,北京猿人的大脑重量上升到850克。同时,大脑皮层灰质和白质发生变化,灰质就是神经原,神经原之间的连接现在变得越来越稠密化,这是一个非常大的变化。

第二个变化,“手的自由度越来越高,越来越灵巧,特别是人的肌肉纤维。有句话叫心灵手巧,古代人所讲的‘心’,就是现在认为的大脑。大脑越聪明手才能越来越灵巧。”由人的操作,孙教授引出机器人的灵巧操作是由人工智能控制机器学习复杂的技能,主要为指挥机器人的灵巧手进行机器操作。其由两部分构成“一个是上行部分,感知部分;一个是下行部分,动作部分。这两个部分正好表达了一个人的操作过程”。

99983.jpg

孙富春教授进行演讲

基于该理论,孙教授对比了人的脑手协同操作与认知机器人的操作。“目前机器学习是一个地地道道的开环学习,就是大量图片训练形成一个映射关系,映射关系不对则无法纠正其操作。”利用乌鸦喝水的例子,孙教授又指出:“人的学习是通过一个闭环的反馈形成对事物的认知,属于闭环认知。人的知识是在不断与环境交互的过程中积累起来的,增长的知识又反过来指导感知,最后形成一个知识驱动下的数据学习。因此,从知识增强到指导感知,两个过程形成一个闭环。”

就当前机器人学习发展的现状来看,虽然已经极大程度上向人类学习借鉴,但“机器人感知仅仅进行了某种半结构化学习过程,在动态过程里面机器人仍然没有像人一样处理问题的能力。”

针对该问题的解决,孙教授指出,目前欧洲已经启动了RoboEarth计划,试图让机器人共享知识并存储它们的发现。这意味着机器人很快将拥有自己的互联网和维基百科。孙教授十分赞同这一发展方向,“机器人通过知识的不断积累,再不断利用知识,指导面向动态的复杂环境里的感知和行为学习,这是未来一个非常重要的出路。未来机器人一个最重要部分是像人一样,能够积累知识,产生知识,不断增强知识,从而将知识应用在复杂环节和复杂操作过程里面。”

99984.jpg

RoboEarth操作模式

知识即经验,使机器人能够积累经验并进行更为灵巧的操作是孙教授团队目前在做的一个重要工作,也是本次报告的第二部分。孙教授指出,机器人积累经验分为三个层次,即:任务语义层经验、规划层经验、操作层经验。

第一层次包括经验表达、收集、概念化和预测机制;第二层次包括基于经验的规划、并行化和异常处理技术;第三层次包括机械臂精准操作、共享控制遥操作。针对这三个层次所包含的具体内容,孙教授进行了详细讲解。除此之外,想要实现机器人的灵巧操作,还需要涉及第三部分的内容,即“知识与数据结合”。

99985.jpg

与会专家认真听取孙富春教授发言

目前,机器人的学习可分为三个模式,即:强化学习(智能体和环境交互,最大化获得回报)、模仿学习(智能体观测专家和环境交互过程,学习专家行为逻辑)、偏好学习(专家观测并评估智能体和环境交互过程,智能体学习最大化专家评估的策略)。孙教授认为后两种学习模式是当前较好的学习模式,但以上两种学习模式中也存在两个问题,即“机器人如何在最短时间里把人类行为学出来?如何做到知识迁移?”

99986.png

强化学习示意图

99987.png

模仿学习示意图

99988.png

偏好学习示意图

对于这两个问题,孙教授的团队做出了卓有成效的探索。针对第一个问题,在设置结果观测的同时,通过最小化逆动力不一致性实现基于观测的主动模仿学习。针对第二个问题,该团队做了两种模型,一个是原地知识迁移,第二个是知识聚集迁移。例如机器手弹钢琴的过程设计和四足机器人的嗅觉追踪。

99989.jpg

灵巧手弹钢琴

在报告的最后两个部分,孙教授概述了其团队所做的相关工作并对未来机器人智能发展前景进行了展望。孙教授团队去年参加中国制造大会时做的假肢,六个相关指标都超越了国际当前水平。最近其团队开发的多模态触觉传感装置,可以感知灵巧手操作过程中物体表面的纹理、温度和三维操作力,该装置拿到了今年机器人灵巧操作手大赛冠军。

99900.jpg

99901.jpg

99902.png

参赛照片及获奖证书

今年其团队聚焦人工智能的重要部分,即:如何研究基于记忆表征的跨模态学习,包括跨模态刺激生成。比如,安装假肢的患者哪怕外肢神经完全坏死,也可以通过人工智能的跨模态交叉学习技术,在大脑内产生触感,再利用多通道意图识别实现解码。孙教授直言,这将是人工智能未来发展中非常重要的部分。

99903.jpg

孙富春教授进行演讲

报告的最后,孙教授为人工智能产业年会赋诗一首,在此与大家共勉:

《贺人工智能产业峰会》
孙富春
手脑相合创智能,仿生技艺竟鲲鹏。
宽深学习呈佳绩,类脑知识启远征。
古代伶人妆艺妓,今朝机仆扮龙腾。
智能产业添金翼,开拓唯新励志登。
99904.jpg

唐杰教授为孙富春教授颁发组委会感谢状

往期回顾:

《2019人工智能发展报告》重磅发布!

2019中国人工智能产业年会 | “知识智能及其产业应用”分论坛成功召开

知识赋能AI——张钹院士担任智谱公司首席顾问

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多