所有文章 > 正文

自然语言处理研究报告(2018年第八期)

作者: 学术君

时间: 2019-09-29 18:27

自然语言处理是包括了计算机科学、语言学心理认知学等一系列学科的一门交叉学科,这些学科性质不同但又彼此相互交叉。

报告(PPT)下载:https://static.aminer.cn/misc/article/nlp-p.pdf

自然语言处理是包括了计算机科学、语言学心理认知学等一系列学科的一门交叉学科,这些学科性质不同但又彼此相互交叉。

1950年图灵提出了著名的“图灵测试”,这一般被认为是自然语言处理思想的开端。

20世纪50年代到70年代自然语言处理主要采用基于规则的方法

70年代以后随着互联网的高速发展,自然语言处理思潮由理性主义向经验主义过渡,基于统计的方法逐渐代替了基于规则的方法。

从2008年到现在,在图像识别和语音识别领域的成果激励下,人们也逐渐开始引入深度学习来做自然语言处理研究。

由最初的词向量到2013年word2vec,将深度学习与自然语言处理的结合推向了高潮,并在机器翻译、问答系统、阅读理解等领域取得了一定成功。

接下来AMiner将为大家介绍自然语言处理的业界发展,涵盖了以下企业。

微软亚洲研究院1998年成立自然语言计算组,研究内容包括多国语言文本分析、机器翻译、跨语言信息检索和自动问答系统等。

这些研究项目研发了一系列实用成果,如IME(Input Method Editors输入法编辑器,它是一种专门的应用程序, 用来输入代表东亚地区书面语言文字的不同字符。)、对联游戏、Bing词典、Bing翻译器、语音翻译、搜索引擎等,为微软产品做出了重大的贡献。

并且在自然语言处理顶级会议,例如ACL、COLING等会议上发表了许多论文。

语音翻译

2017年微软在语音翻译上全面采用了神经网络机器翻译,并新扩展了Microsoft Translator Live Feature。

可以在演讲和开会时,实时同步在手机端和桌面端,同时把讲话者的话翻译成多种语言。

其中最重要的技术是对于源语言的编码以及引进的语言知识,同时,微软还表示,将来要将知识图谱纳入神经网络机器翻译中规划语言理解的过程中。

人机对话

小娜现在已经拥有超过1.4亿用户,在数以十亿计的设备上与人们进行交流,并且覆盖了十几种语言。

有聊天机器人小冰,正在试图把各国语言的知识融合在一起,实现一个开放语言自由聊天的过程,目前小冰实现了中文、日文和英文的覆盖,有上亿用户。

Google

Google是最早开始研究自然语言处理技术的团队之一,作为一个以搜索为核心的公司,Google对自然语言处理更为重视。

Google拥有着海量数据,可以搭建丰富庞大的数据库,可以为其研究提供强大的数据支撑。

Google对自然语言处理的研究侧重于应用规模、跨语言和跨领域的算法。

机器翻译

知识图谱

Google的知识图谱更是遥遥领先,例如自动挖掘新知识的准确程度、文本中命名实体的识别、纯文本搜索词条到在知识图谱上的结构化搜索词条的转换等,效果都领先于其他公司,而且很多技术都实现了产品化。

语音识别

Google一直致力于投资语音搜索技术和苹果公司的siri竞争,自2012年以来将神经网络应用于这一领域,使语音识别错误率极大降低。

2011年收购语言信息平台SayNow,把语音通信、点对点对话、以及群组通话和社交应用融合在一起。

2014年收购了SR Tech Group的多项语音识别相关专利。

Facebook

Facebook涉猎自然语言处理较晚,2013年开始发展语音翻译,2015年开始语音识别的研发之路。

语音翻译

语音识别

2015年,Facebook相继建立语音识别和对话理解工具,开始了语音识别的研发之路。

2016年Facebook开发了一个响应“Hey Oculus”的语音识别系统。

并在2018年初开发了wav2letter,这是一个简单高效的端到端自动语音识别(ASR)系统。

百度

百度自然语言处理部是百度最早成立的部门之一,研究涉及以下方面。

百度在深度问答方向经过多年打磨,积累了问句理解、答案抽取、观点分析与聚合等方面的一整套技术方案,目前已经在搜索、度秘等多个产品中实现应用。

百度翻译目前支持全球28种语言,覆盖756个翻译方向,支持文本、语音、图像等翻译功能,并提供精准人工翻译服务,满足不同场景下的翻译需求,发布了世界上首个线上神经网络翻译系统,并获得2015年度国家科技进步奖。

阿里巴巴

阿里自然语言处理为其产品服务,在电商平台中构建知识图谱实现智能导购,同时进行全网用户兴趣挖掘,在客服场景中也运用自然语言处理技术打造机器人客服。

例如蚂蚁金融智能小宝、淘宝卖家的辅助工具千牛插件等,同时进行语音识别以及后续分析。

阿里的机器翻译主要与其国家化电商的规划相联系,2017年初阿里正式上线了自主开发的神经网络翻译系统,进一步提升了其翻译质量。

腾讯

AI Lab是腾讯的人工智能实验室,研究领域包括计算机视觉、语音识别、自然语言处理、机器学习等。

其研发的腾讯文智自然语言处理基于并行计算、分布式爬虫系统,结合独特的语义分析技术,可满足自然语言处理、转码、抽取、数据抓取等需求。

在机器翻译方面,2017年腾讯宣布翻译君上线“同声传译”新功能,用户边说边翻的需求得到满足,语音识别+NMT等技术的应用保证了边说边翻的速度与精准性。

京东

京东在人工智能的浪潮中也不甘落后。京东AI开放平台基本上由模型定制化平台和在线服务模块构成,其中在线服务模块包括计算机视觉、语音交互、自然语言处理和机器学习等。

按照京东的规划,NeuHub平台将作为普惠性开放平台,不同角色均可找到适合自己的场景,例如用简单代码即可实现对图像质量的分析评估。

从业务上说,平台可以支撑科研人员、算法工程师不断设计新的AI能力以满足用户需求。

并深耕电商、供应链、物流、金融、广告等多个领域应用,探索试验医疗、扶贫、政务、养老、教育、文化、体育等多领域应用。聚焦于新技术和行业趋势研究,孵化行业最新落地项目。

科大讯飞

科大讯飞股份有限公司成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的国家级骨干软件企业。

科大讯飞作为中国智能语音与人工智能产业领导者,在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。

科大讯飞成立之时就开始在语言和翻译领域布局项目。基于深度神经网络算法上的创新和突破,在翻译方面的发展如下图所示。

二维码 扫码微信阅读
下载报告
推荐阅读 更多