所有文章 > 正文

数据分析IJCAI 2020:人工智能女神拥抱认知时代

作者: AMiner科技

时间: 2020-12-21 14:30

有意围观 IJCAI 2020 的小伙伴们,请看过来~

AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。



作为 1956 年达特茅斯研讨会的延伸,在人工智能学者们的倡导下,第一节国际人工智能联合会议于 1969 年在美国华盛顿召开,逐渐成长为人工智能领域最重要的学术会议之一,许多影响世界的重要人工智能科技成果脱胎于 IJCAI 会议上的研究论文。2010 年以前,华人学者在 IJCAI 上鲜有发表,能获得 IJCAI 评审的青睐被视为无上的殊荣。近年来,随着人工智能研究浪潮的到来,IJCAI 等人工智能顶级会议的投稿量猛增。由于缺乏高水平的审稿人、审稿监督机制不完善等因素,许多人工智能学术会议的口碑受到了一定程度的负面影响。在最新版的《清华大学计算机学科推荐学术会议和期刊列表》中,IJCAI 被归为 B 类学术会议。

图 1:清华大学计算机学科推荐学术会议和期刊列表

为了重振 IJCAI 的学术声誉,在 IJCAI 2019 大会期间,由多名曾经担任 IJCAI 程序主席的权威学者举办了一场具有历史性意义的研讨会,共同商讨如何应对人工智能顶会面临的发展难题。因此,本届 IJCAI 组委会采取了包括严格的拒稿、Rebuttal、Summary reject 机制在内的一系列措施严格把控论文评审质量。最终,本届 IJCAI 在 4717 份投稿中仅仅录用了 592 篇论文,录用率低至 12.6%,充分保障了录用论文的水平。

图 2:IJCAI 历年论文接收率

由于疫情原因,原定于 2020 年 7 月 11 日召开的 IJCAI 2020 将延期至 2021 年 1月 7 日至 2021 年 1 月 15 日举行,现在距离 IJCAI 2020 大会召开仅剩半个月左右的时间。在IJCAI2020会议结果公布后,AMiner推出了IJCAI2020会议系统,通过交互式多维会议导航,真正实现了通过论文看作者、通过作者找论文、论文实现代码,并融合论文解读、论文推荐、华人学者以及整体会议的大数据分析,让大家更快更全面的了解到IJCAI2020的研究发展趋势和论文情况等,提供会议助理、会议多维分析、作者和论文搜索等服务。
据 AMiner 统计,IJCAI2020 共录用论文 645 篇,共涉及论文作者 2492 人。其中 176 位作者有 2 篇入选,33 位作者有 3 篇论文,8 位作者有 4 篇入选,大于等于 5 篇论文的作者共有 2 位。

其中,南京大学高阳、郝建业两位华人学者被 IJCAI 录用论文高达 5 篇至多,杜博、汪萌、李文斌、俞勇、安波、查振军、蔡少伟等华人学者也被录用了 4 篇论文,表现抢眼。

南京大学高阳教授的主要研究方向为强化学习、学习理论、学习分类系统、特征提取、数据挖掘等,他在本届 IJCAI 上被录用的 5 篇论文涉及小样本学习、图神经网络、网络架构搜索、人脸识别、表征学习等话题。

天津大学郝建业副教授的主要研究方向为多智能体学习、多智能体系统、博弈论等,他在本届 IJCAI 上被录用的 5 篇论文涉及多模态学习、深度强化学习、对抗生成网络、博弈论等话题。

从每篇论文作者数量来看,IJCAI2020 接收的论文大多数都有 3-4 个作者,其中有4个作者的共有 149 篇,有3个作者的共有 130 篇,拥有 10 个作者及以上的论文共有 6 篇,最多的 1 篇文章拥有 11 个作者。

从作者所属国籍来看,华人作者在 IJCAI 大会上的影响力进一步提升。在本届大会上,华人作者参与的论文共有 451 篇,占总论文数的 69.92%。其中华人一作论文共有 356 篇,占华人参与论文数的 78.94%,占总论文数的 55.19%。

从论文所属机构来看,中国科学院组合高居榜首,入选论文共计42篇。微软和浙江大学排名第二,有28篇论文入选。清华大学排名第三,都有26篇入选。国内高校中国科学院入选论文最多,排在总榜的第1位;浙江大学有28篇入选,排在总榜第2位。


如图 10所示,根据 Aminer 对本届 IJCAI 录用论文的话题统计词云显示,表征学习、图神经网络、注意力机制、深度强化学习等研究方向在本届 IJCAI 上十分热门。

表征学习

表征学习旨在将原始数据转换为能够被机器学习算法利用的数据形式。在深度学习出现之前,机器学习从业者需要根据领域知识,手动清洗、筛选、提取、变换原始数据,这一过程极为繁琐,需要耗费极大的成本。随着深度学习的发展,人们越来越多地依赖于神经网络强大的感知能力,自动地学习可以用于下游任务的数据特征。如今,面对图学习、多模态学习新兴的任务,如何设计合理的表征学习框架,充分高效地挖掘图数据的节点信息与结构信息、如何融合并利用各种模态的有效信息成为了表征学习的研究热点。在 IJCAI2020 上,有18篇表征学习方向的论文发表,内容涉及无监督表征学习、图表征学习、多视图学习、知识图谱嵌入等话题。

图神经网络

尽管深度学习技术在计算机视觉、自然语言处理等领域取得了空前成功,但是这些任务高度依赖于结构化的输入数据。对于现实世界中大量非欧空间中的数据来说,传统的 CNN、RNN 等技术较为乏力。因此,图神经网络 GNN 由于其对于图数据强大的建模、推理能力成为了当下人工智能领域最炙手可热的新星。成为了实现从感知走向认知的第三代人工智能技术的必经之路。尽管图神经网络具有重要的使用价值,但是目前其理论研究仍处于起步阶段,具有广阔的研究空间。在 IJCAI2020 上,有23篇图神经网络方向的论文发表,内容涉及邻居节点交互、图注意力机制、节点消歧、人工智能制药、对话理解、智能合约等研究课题。

深度强化学习

强化学习是人工智能重要分支——行为主义学派的代表技术。如今处于主导地位的深度学习技术具有强大的感知能力,但是其决策能力有限;而基于试错机制的强化学习技术具有很强的决策能力,但受限于感知环境的能力。近年来,随着对抗学习、多智能体系统等任务的兴起,深度强化学习受到了越来越多研究者的关注。如今,研究者们通过深度学习方法为强化学习智能体感知环境,学习到相应的状态特征,并计算奖励函数。在IJCAI2020 上,有12篇深度强化学习方向的论文发表,内容涉及对抗生成网络、课程学习、强化学习中的自注意力信用分配等话题。

自然语言处理相关

自然语言处理是人工智能技术最重要的应用场景之一。据不完全统计,在本届 IJCAI 2020 大会上,与 NLP 方向相关论文高达82篇,涉及语言生成、注意力机制、实体识别、知识抽取等话题。从算法的角度来看,本届 IJCAI 上出现了多篇涉及无监督预训练、面向任务的预训练的论文;跨语言学习、元学习、小样本学习、迁移学习技术在 NLP 领域的研究得以进一步发展;许多研究人员开始关注解决 NLP 场景下的数据偏见问题;知识融合技术在阅读理解、问答系统、事件因果关系识别、对话生成、机器翻译等领域得到了重视。从任务的角度来看,问答系统、自然语言生成、多模态学习等话题仍然是本届 IJCAI 大会最受瞩目的研究领域。
由于如今大多数的人工智能技术都是数据驱动型技术,对于数据的标注质量和数据规模有着较高的要求。为了使人工智能技术具有更高的普适性,研究者们针对迁移学习、弱监督学习、领域自适应、无监督学习、度量学习等有助于提升数据利用率的技术展开了广泛的研究。


更多IJCAI2020论文,可以关注公众号或者链接直达IJCAI2020专题,最前沿的研究方向和最全面的论文数据等你来~扫码查看更多IJCAI 2020论文


欢迎各位作者老师和同学加入IJCAI2020论文分享团队,促进学术交流,让知识正真流动起来!

二维码 扫码微信阅读
推荐阅读 更多