所有文章 > 正文

WWW2019 | 大规模网络表示学习方法

作者: 裘捷中

浏览量: 729

时间: 2019-08-21 07:55

关键词: WWW,大规模,网络表示学习方法,论文推荐

在这项工作中,我们提出了大规模网络嵌入的稀疏矩阵分解(NetSMF)算法。NetSMF利用graph spectral sparsificatin的理论来有效地稀疏化前面提到的稠密矩阵,从而大大提高了表示学习的效率。

论文 : http://keg.cs.tsinghua.edu.cn/jietang/publications/www19-Qiu-et-al-NetSMF-Large-Scale-Network-Embedding.pdf

代码与数据 : https://github.com/xptree/NetSMF

PPT : http://keg.cs.tsinghua.edu.cn/jietang/publications/2019-Graph%20Embedding%20and%20Reasoning-v2.pptx

我们研究了大规模网络嵌入问题,旨在探索大规模网络挖掘中表示学习的新算法。以往的研究表明,当下流行的网络嵌入的基线算法,如DeepWalk,本质上是隐式分解一个和图拉普拉斯相关的矩阵,显式地分解这样的矩阵(NetMF算法)可以产生高质量的嵌入。然而,直接构造和分解这个稠密的矩阵在时间和空间上都是异常昂贵的,这使得直接分解的方法不适合大型网络。

www4.jpg

图: 网络表示学习示例

www3.png

表: 集中网络表示学习方法的特点对比

在这项工作中,我们提出了大规模网络嵌入的稀疏矩阵分解(NetSMF)算法。NetSMF利用graph spectral sparsificatin的理论来有效地稀疏化前面提到的稠密矩阵,从而大大提高了表示学习的效率。稀疏矩阵与原始稠密矩阵在理论上有理想的近似误差,这有助于保持嵌入的表示能力和质量。我们在不同规模和类型的网络上进行实验。结果表明,在常用的基线算法和基于矩阵分解的方法中,NetSMF是唯一一种既高效又有效的方法。我们的实现表明,NetSMF只需要24小时就可以为具有数千万个节点的大型学术协作网络生成有效的嵌入,而这将花费DeepWalk算法几个月的时间。下图和表分别列出了NetSMF的精度结果和时间开销。

www22.jpg

图:在五个数据集上的精度结果。其中在OAG(近10亿条边)的网络上,只有NetSMF和LINE能跑出结果。证明了NetSMF处理大规模网络的能力。

www1.png

表:时间开销

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

扫码微信阅读
[关于转载]:本文转载于裘捷中,仅用于学术分享,有任何问题请与我们联系:report@aminer.cn。