所有文章 > 正文

AI胶囊系统(Capsnet)助力图像分类技术取得重大突破

作者: Jansfer

时间: 2019-07-02 10:44

最近,在人工智能领域最重要的理论家和最新一届的图灵奖获得者Geoffrey Hinton提出了一个名为CapsNet的机器学习架构,这是这一种基于主流的基准图像分类性能,通过区别训练的多层次方法,并取得了可喜的成果。

图片来源:Getty Images

在后续的工作中,他和他的学生,连同牛津机器人研究所的研究人员介绍了一种胶囊网络,这种网络能够出色胜任在无人监督条件下的分类任务。相关成果被发表在Arxiv.org上。

胶囊系统使用几何方法,通过解释相互关联的部分所构成的集合来实现理解对象的目的。对于不同的对象属性(例如位置,大小,颜色等),对应独立激活的胶囊(数学函数)的集合被添加到卷积神经网络上,这是一种常用于分析视觉图像的AI模型,而输出结果可以被重写以形成更“高阶”的胶囊系统,从而更稳定地表示。除此之外,由于表示结果在整个过程中都保持了完整性,因此即使在视点发生变化时,例如转移或交换图片要素的位置的时候,胶囊系统仍然可以完成识别对象的任务。

胶囊系统的另一个独特之处在于他们更注重“路线”。和所有的神经网络一样,叫你那个的功能被安排在互联层中,从输入端传输信号数据并且缓慢调节每个链接的突触强度,这也就形成了权重,这也是这些网络是如何提取特征并且学习如何进行预测的最重要一环。但是在胶囊系统中,权重是根据前一层函数预测下一层函数的输出的能力而进行动态计算的。

目前,Hinton和他的同事们的主要工作是研究一种神经编码器,它可以在查看图片样本的同时尝试消除物体本身的状态与姿势。它使用解码器进行训练,该解码器使用预测姿势的交叉与混合来预测已经发现的图像部分的姿势,再通过自动编码器分割,并且将每个图像像素建模成由变换部分做出的预测的混合。然后在未标记的数据上学习胶囊系统。对象胶囊更有可能形成紧密的集合,并且为每个紧密集合分配一个类,系统学习了来自Google街景图像的超过600,000个房屋号码真实图像的数据集,这个类会在街景房号数据集上进行无监督分类,从而产生预期的结果。

图|胶囊系统的示意图

论文链接:https://arxiv.org/pdf/1906.06818v1.pdf

参考:https://venturebeat.com/2019/06/27/2510417/

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多