所有文章 > 正文

社交网络分析问题:行为预测、关系识别、属性识别

作者: 方展鹏

时间: 2019-06-13 10:37

随着在线社交网站的不断发展,基于社交网络分析的研究是近年来受到很多关注的一个领域。

而在本文中,我们提出的随机因子图模型也会应用到与社交网络分析领域的三个问题社交行为预测、社会关系识别和用户属性识别当中。因此在本节,将会从社交行为的分析研究、社交关系的分析研究和用户属性的分析研究三个方面出发,介绍目前在这三个方面的研究成果。

社交行为的分析研究

关于社交行为的分析研究有很多,其中很大一部分工作都是集中在对用户关注行为的研究上。Romero和Kleinberg[27] 研究了用户三角关注关系的形成过程,给出了一个基于偏好粘连的方法,用于研究有向图的三角关系形成过程。 Shi等人[28] 通过网络论坛的数据,研究了用户参与行为的模式,得出了对参与行为有影响的重要因素。Hopcroft等人[20] 研究一个用户被关注之后,他下一步关注行为的模式。Backstrom等人[29] 提出了一个分割数据的方法,使得可以找出一个群体里面行为活跃的人。此外Newman 等人[30]和Katz 等人[31] 都基于静态关系网络的信息,研究了用户关系的形成。Lichtenwalter 等人[32]基于网络流的思想设计了一个算法用于用户关注行为的预测。Tang等人[18]研究在了不同话题下用户对相互行为的影响,提出了一个话题相似度传播模型来对话题级别的社会影响力进行建模,并给出一个基于MapReduce 计算框架的并行计算算法来计算出这个影响力。Tan等人[19] 研究社交行为是如何在一个动态的社交网络中演化,并提出了一个基于时间变化的容噪的因子图模型对问题建模,并用于预测用户的社交行为。

社交关系的分析研究

在推测社交关系类型这个问题上,已经很多有效的工作。Diehl等人[33]尝试通过学习出一个排序函数的方式识别出管理者-下属关系。Wang等人[34] 提出了 一个无指导的概率图模型用于从学术合作网络中挖掘出师生关系。Crandall 等 人[35]研究了能否根据人们在不同的时间和地点同时出现的信息来推断相互之间是否是朋友这个问题。Tang 等人[16]提出了一个基于部分标记的因子图模型的机器学习框架,用于推测不同网络中的社交关系类型。Eagle等人[36]给出了若干、通过移动电话数据挖掘出的关系模式,并尝试通过这些模式去推测出用户之间是否存在朋友关系。Tang等人[21]研究如何利用不同的网络的信息去推断一个网络中关系的类型。

除了推测社交关系的类型之外,与社交关系的分析相关的另外一部分工作是推测社交关系的强度。Xiang等人[37]提出了一个隐变量模型从用户的交互情况以及用户的相似度来推测用户之间的关系强度。Backstrom等人[38]提出了一 个有指导的随机行走算法用于预测社交关系的强度。Leskovec等人[39]通过一个逻辑斯蒂回归模型预测在线社交网络中的正负关系,其中正关系表示相互之间是朋友,负关系表示相互之间是敌人。

用户属性的分析研究

关于用户属性的分析研究在近年来也越来越受到重视。在[40] 中, Leskovec等人提出了一个新的在正负网络中用户的地位属性相关的理论, 提供了一种新的组织正负网络中关系的方法。在[41]中,Conover 等人通过用户发表在Twitter 上的文本信息分析用户的政治倾向属性。在[42]中,McCallum等人通过关注网络的信息以及用户发布的文本信息,去分析用户社交地位属性的差别。在[43]中,Danescu 等人提出了语言中的一些特定的特征能够提供用户在一个群组里面的角色属性、地位属性和其他和这个群组相关的属性。

小结

通过对因子图模型学习算法相关工作现状的总结,我们可以看到目前的因子图学习算法在面对海量的社交网络数据时,存在着速度慢或者精度欠缺等缺点,因此十分有必要提出一个新的因子图学习算法来解决现有算法的不足。 而在并行计算方面,可以看到在MapReduce、MPI等经典框架不断成熟的同时,GraphLab等新的框架也不断出现。我们可以利用这些现成的并行开发工具去支持我们现在的工作。在社会网络分析研究方面,虽然这个领域越来越受到重视, 各个方面的研究工作也有很多,但是我们也看到这些工作中,直接在大规模的社交网络进行挖掘分析的并不多,因此如何有效地在大规模社交网络中进行分析是一个值得深入研究的问题。

[20] Hopcroft J E, Lou T, Tang J. Who Will Follow You Back? Reciprocal Relationship Predic- tion. Proceedings of CIKM’11, 2011

[21] Tang J, Lou T, Kleinberg J. Inferring Social Ties across Heterogenous Networks. Proceed- ings of WSDM’12, 2012

[22] Gropp W, Lusk E L, Skjellum A. Using MPI-: Portable Parallel Programming with the Message Passing Interface, volume 1. MIT press, 1999

[23] Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters. Communi- cations of the ACM, 2008, 51(1):107–113

[24] Elsayed T, Lin J, Oard D W. Pairwise document similarity in large collections with MapRe- duce. Proceedings of Proceedings of the 46th Annual Meeting of the Association for Com- putational Linguistics on Human Language Technologies: Short Papers. Association for Computational Linguistics, 2008. 265–268

[25] Dyer C, Cordova A, Mont A, et al. Fast, easy, and cheap: Construction of statistical machine translation models with MapReduce. Proceedings of Proceedings of the Third Workshop on Statistical Machine Translation. Association for Computational Linguistics, 2008. 199–207

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。





二维码 扫码微信阅读
推荐阅读 更多