所有文章 > 正文

KDD2021 表征学习相关的必读论文推荐

作者: 学术头条

时间: 2021-07-21 15:48

AMiner通过AI技术,对KDD2021收录的会议论文进行了分类整理,欢迎下载收藏!

AMiner-KDD2021:https://www.aminer.cn/conf/kdd2021

1.论文名称:Subset Node Representation Learning over Large Dynamic Graphs
论文链接:https://www.aminer.cn/pub/60baf51891e01102e59b6c73


动态图表示学习是一项在动态网络上学习节点嵌入的任务,具有许多重要的应用,包括知识图、引文网络到社交网络。这种类型的图通常是大规模的,但只有一小部分顶点与下游任务相关。当前的方法对于这种设置来说过于昂贵,因为复杂性充其量是线性依赖于节点和边的数量。在本文中,我们提出了一种新方法,即动态个性化 PageRank 嵌入,用于在大规模动态网络上学习节点表示的目标子集。基于局部节点嵌入的最新进展和动态个性化 PageRank 向量 (PPV) 的新计算,DynamicPPE有两个关键因素:1) per-PPV 复杂度低;2)通过使用这些高质量的 PPV 和哈希内核,学习到的嵌入具有局部性和全局一致性的特性。这两者使得有效地捕捉图结构的演变成为可能。实验结果证明了该方法在大规模动态网络上的有效性和效率。


2.论文名称:Privacy-Preserving Representation Learning on Graphs: A Mutual Information Perspective
论文链接:https://www.aminer.cn/pub/60d996c80abde95dc965f5c2


用图学习最近引起了极大的关注。现有的图表示学习方法在节点分类、链接预测等各种图相关任务上取得了最先进的性能。然而,我们观察到这些方法可能会泄漏严重的私人信息。例如,人们可以从通过现有方法在学习到的节点表示上训练的节点分类器(或链接预测器)准确地推断出图中的链接(或节点身份)。为了解决这个问题,我们从互信息的角度提出了一种保护隐私的图表示学习框架。具体来说,我们的框架包括一个主要的学习任务和一个隐私保护任务,我们将节点分类和链接预测视为两个感兴趣的任务。我们的目标是学习节点表示,以便它们可用于实现主要学习任务的高性能,同时获得接近随机猜测的隐私保护任务的性能。我们通过互信息目标正式制定我们的目标。然而,在实践中计算互信息是棘手的。然后,我们为互信息项导出易处理的变分边界,其中每个边界都可以通过神经网络进行参数化。接下来,我们训练这些参数化神经网络来近似真实的互信息并学习隐私保护节点表示。我们最终在各种图形数据集上评估我们的框架。


3.论文名称:Exploring Self-Supervised Representation Ensembles for COVID-19 Cough Classification
论文链接:https://www.aminer.cn/pub/60a3a67d91e01115219ffa65


使用通过深度学习模型训练的智能手机收集的呼吸音来检测和分类 COVID-19 最近变得流行。它消除了亲自测试程序的需要,尤其是在相关医疗用品、经验丰富的工人和设备有限的农村地区。然而,现有的基于声音的诊断方法是以完全监督的方式训练的,这需要大规模的标记良好的数据。发现利用未标记呼吸数据的新方法至关重要,这些数据可以更容易地获得。在本文中,我们为 COVID-19 咳嗽分类提出了一种新颖的自监督学习框架。引入对比预训练阶段以使用未标记数据训练基于 Transformer 的特征编码器。具体来说,我们设计了一种随机掩蔽机制来学习呼吸声音的稳健表示。然后在下游阶段对预训练的特征编码器进行微调以执行咳嗽分类。此外,在下游阶段还探索了具有不同随机掩蔽率的不同合奏。通过广泛的评估,我们证明了所提出的对比预训练、随机掩蔽机制和集成架构有助于提高咳嗽分类性能。


4.论文名称:Enhancing Taxonomy Completion with Concept Generation via Fusing Relational Representations
论文链接:https://www.aminer.cn/pub/60c1781591e0112cf43c1fa2


分类法的自动构建支持电子商务、网络搜索和问答中的许多应用程序。现有的分类扩展或完成方法假设新概念已被准确提取,并且它们的嵌入向量是从文本语料库中学习的。然而,修复分类不完备性的一个关键和基本挑战是提取的概念的不完备性,特别是对于那些名称中有多个单词并因此在语料库中出现频率较低的概念。为了解决基于提取的方法的局限性,我们建议 GenTaxo 通过识别现有分类法中需要新概念的位置,然后生成适当的概念名称来增强分类法的完成度。GenTaxo 不依赖于语料库进行概念嵌入,而是从其周围的基于图和基于语言的关系信息中学习上下文嵌入,并利用语料库对概念名称生成器进行预训练。实验结果表明,与现有方法相比,GenTaxo 提高了分类法的完整性。



二维码 扫码微信阅读
推荐阅读 更多