所有文章 > 正文

拓扑数据分析可将机器学习提升至全新的水平

作者: Jansfer

时间: 2019-09-05 09:40

意大利数学家团队与葡萄牙尚帕利莫德未知中心(CCU)的神经科学家,已经证明人造视觉机器可以通过使用25年前开发的数学理论进行机器学习并能够更快地识别复杂图像。相关研究结果发表在《Nature Machine Intelligence》杂志上。

拓扑数据分析可将机器学习提升至全新的水平1.png

图|这种新方法使人工智能能够更快地学会识别转换后的图像(图片来源:Diogo Matias)

近几十年来,人造视觉机的性能有了很大的提高。通过系统的训练学习人造视觉系统可以识别几乎任何人脸,甚至可以识别任何在鱼缸里游动的鱼。

事实上,人造视觉机器是生物神经元网络的电子模型,它们的目的是模拟大脑的功能,大脑在不需要任何有意识努力的情况下就能出色地完成这些视觉任务。但是这些人工神经网络是如何进行学习的呢?以人脸识别为例,这种机器可以通过一系列肖像的形式获得关于人脸的相关信息。具体而言,是将肖像信息数字化成像素值矩阵,每幅图像都会经过神经网络的“处理”,然后神经网络从一组样本人脸(如眼睛、嘴巴、鼻子等)中提取有代表性的相关特征。这种深度学习使机器能够输出另一组数据值,使它能够识别出从未在人脸数据库中见过的脸从而非常准确地预测出那张脸属于谁。

但是,在神经网络能够很好地实现这一点之前,它通常需要用数千个面(即数字矩阵)来表示。此外,尽管这些机器在模式识别方面越来越成功,但事实上当它们学习任务时,机器内部基本上是黑匣子,没有人真正知道它们内部是如何工作的。这就意味着人们无法确定机器从原始数据中提取了哪些特征或多少特征,甚至无法确定这些特征中有多少对人脸识别真正有意义。

该研究的第一作者、加州大学系统神经科学实验室的Mattia Bergomi说:“为了更好地说明这一点,可以考虑一下聪明的马的案例。” 这个故事发生在20世纪初,主人公是德国一匹名叫汉斯的马。他的主人对外界声称这匹马已经学会了算术,它前蹄跺地的次数就是加减法等运算的结果。许多人相信这匹马会数数,《纽约时报》甚至报道了这匹马。但后来,一位德国心理学家在1907年指出,这匹马实际上是从主人的肢体语言中获得无意识的暗示,从而会准确地停止跺地。

“机器学习也是如此。我们无法控制它是如何工作的,也无法控制它在训练中学会了什么,” Bergomi解释道。这台机器没有关于人脸识别的知识,只是以某种方式来进行这项工作。这便使得研究人员探究是否可能有一种方法,能够在模型训练之前将关于面部或其他物体的一些知识注入神经网络,以便使其探索更有限的可能特征空间。Bergomi表示,研究人员更想控制学习功能的空间。这就像一个平庸的棋手和一个专家之间的区别:前者能看到所有可能的走法,而后者只能看到好的走法。

他说,另一种说法就是说这项研究解决了以下简单的问题:当研究人员训练深度神经网络来区分道路标志时,应该如何告知这个网络。如果这个神经网络只能识别像圆形和三角形这样的简单的几何形状,那么它的工作将会容易得多。

科学家们推断,这种方法将大大减少训练时间,并且可以给他们提示,让他们知道机器可能正在做什么并预测将会获得什么样的结果。毕竟让人类驱动学习机的学习过程,是朝着更容易理解的人工智能迈进的基础,也是降低当前神经网络训练所需的时间和资源成本的基础。

那这种神经网络会识别什么样的形状呢?一个抽象的数学理论称拓扑数据分析(TDA)是回答这个问题的关键。拓扑是最纯粹的数学形式之一。但直到最近,人们还认为拓扑结构在很长一段时间内不会适用于任何具体的东西,直到最近几年TDA才变得广为人知。意大利数学家帕特里齐奥·弗洛西尼(Patrizio Frosini)于1992年推进了TDA发展的第一步。

拓扑学是一种扩展的几何学,它不是测量如三角形、正方形、圆锥体等刚性形状中的线和角,而是根据形状对高度复杂的物体进行分类。例如,对于拓扑学者来说,甜甜圈和杯子是同一个物体,因为一个可以通过拉伸或压缩变形成另一个。

现在的问题是,目前的神经网络并不擅长拓扑。例如,它们不能识别旋转的对象。对他们来说,相同的物体每次旋转时看起来都是完全不同的。正因为如此,唯一的解决方案就是让这些网络“记住”这些成千上万个点的每一个位置。而这些是研究人员计划通过使用TDA来避免的。

TDA可以被看作是一个数学工具,可以用于在任何复杂的对象中发现有意义的内部结构(拓扑特征)。这是通过某些精心选择的” 镜头”或过滤器进行数据查看来实现的。这些数据本身可以是关于人脸、金融交易或癌症存活率等。TDA使得教会神经网络识别人脸成为可能,而无需将人脸在空间中可能呈现的不同方向呈现出来。即使是在不同的旋转位置,这台机器也能把所有的脸都识别为一张脸。

在他们的研究中,科学家们通过教授神经网络识别手写数字,测试了机器学习和TDA结合的好处。但由于这些神经网络没有进行关于拓扑的训练,并且手写的数字可能会非常模糊,因此两个不同的手写数字可能无法被区分开来。相反,它们可能将同一个手写数字的两个实例识别成不同的信息。

为了注入关于数字的知识,研究小组建立了一组他们认为有非常有意义的“透镜”,通过它网络可以看到数字并迫使机器在这些透镜中做出选择来查看图像。TDA增强的神经网络学习区分5和7所需要的图像数量的时间,无论写得多么差,它在保持其预测能力的同时,识别时间仅有略微下降。

Bergomi说:“我们在研究中从数学上描述的是如何加强对称性,这为构建机器学习代理提供了一种策略,通过利用作为约束注入的知识,这些机器能够从几个例子中识别出显著的特征。”

这是否意味着模仿大脑的学习机的内部工作机制将在未来变得更加透明,从而对大脑本身的内部工作机制产生新的见解?无论如何,这是Bergomi的目标之一。他说,“人工智能的可理解性对于它与生物智能的互动和整合是必要的。”目前,他正在与同事皮埃特罗·韦尔蒂奇(Pietro Vertechi)合作,开发一种新型的神经网络架构,这种架构将允许人类迅速将高级知识注入这些网络,以控制和加快他们的训练。

参考:https://techxplore.com/news/2019-09-math-machine.html

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多