所有文章 > 正文

又接近了人类一步!感知视觉信息的新型人工智能

作者: Jansfer

时间: 2019-06-03 15:47

计算机学家已经教会了人工智能代理如何做一些仅有人类能做的事情,例如迅速瞥一眼并审视四周,这项技能对于开发高效搜救机器人而言是必不可少的,有朝一日机器人必然能提高危险任务的完成率。

由德克萨斯大学奥斯汀分校的Kristen Grauman教授、博士候选人Santhosh Ramakrishnan和前博士候选人Dinesh Jayaraman领导的团队将其成果发表在期刊Science Robotics上。

图|人工智能理念(来源:TanyaJoy / Adobe Stock)

多数人工智能代理,即赋予机器人或其他机器智能的计算机系统,在以往经历过的环境中(如工厂)接受特定的训练,例如识别某一目标或计算其体积。但是Grauman和Ramakrishnan开发的人工智能代理十分通用,能够收集视觉信息并用于多种任务。

Grauman说:“我们想要实现的人工智能代理,它能够在环境中处理新出现的感知任务。由于它已经学习了有关视觉世界的有效模型,因此具有一定通用性,能够成功完成多种的任务”。

同时,科学家使用深度学习的方式,在上千张不同环境的360°全景图中训练他们的人工智能代理,这是一种受大脑神经网络而启发的机器学习方法。

当人工智能代理处在一个之前从未见过的场景中,它会由经验主义选择一小部分图像信息,总计不超过全景信息的20%,如同一个游客在大教堂中央从不同方向拍摄了几张快照。但这个系统的高明之处就在于它不是随意地从某个方向“拍照”,而是在每一次获取图像信息后,选择某一特定方向,预计能够反映出整个场景中更多信息,再进行捕获图像。这就好像你在一家从未来过的杂货店中,当你看见了苹果,你会猜测附近有橘子,但如果你想找牛奶,目光就会扫向其他地方。基于获取的信息,人工智能代理会推测其他方向可能看到的东西,重建出其周围完整的360°全景图。

Grauman说:“正如你在之前经历过的环境中获取了常识与规律,例如你所去过的杂货店,人工智能代理亦是如此,它会智能地猜测获取哪些视觉信息以便成功完成感知任务,这是一种非穷举的搜索方式,不要求获取全部的信息。”

科学家为他们树立的主要挑战是设计一个能在严格的时间限制下工作的人工智能代理,这对于搜救工作而言十分关键。例如,在一个燃烧的建筑物中,机器人应当快速定位伤员、火源和有害物质,并将信息传递给消防员。

目前,新型人工智能代理的运作模式如同一个人站在某一位置上,能够看向任意一个方向,但是无法移动到新的位置。换句话说,人工智能代理能够观察它所持有的物体,并旋转物体以观察其背面。下一步,研究人员将开发新系统并应用于具有机动性的机器人。

研究人员借助德克萨斯大学奥斯汀德克萨斯高级计算中心和计算机科学系的超级计算机,花费大约一天时间,使用一种被称为强化学习的人工智能方法来训练他们的人工智能代理。该团队由Ramakrishnan领导,开发出了一种加快训练的方法:建立第二个人工智能代理,作为伙伴来帮助原本的人工智能代理。

Ramakrishnan称:“借助纯粹在训练中出现的额外信息有助于人工智能代理更快地学习。”

这项研究得到了美国国防高级研究计划局、美国空军科学研究办公室、IBM公司和索尼公司的支持。

链接:https://www.sciencedaily.com/releases/2019/05/190515144017.htm

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

推荐阅读 更多