所有文章 > 正文

谷歌开源了具有人类理解水平的对话数据集

作者: Jansfer

时间: 2019-09-09 15:47

Google于9月6日开源了有关于人类对话的数据集Coached Conversational Preference Elicitation(CCPE)和Taskmaster-1。

谷歌01.png

图片来源:Khari Johnson / VentureBeat

Google于9月6日开源了有关于人类对话的数据集Coached Conversational Preference Elicitation(CCPE)和Taskmaster-1。Google 人工智能研究人员共享了这两个数据集,以便于提供模拟人类自然语言系统所需的培训材料。

CCPE是一种收集语音数据的新方法。谷歌研究人员称CCPE包含了人们最喜爱的电影中的500句对话。之所以将电影作为首选主题,是因为电影背后的像演员和导演的名字这样的元数据的价值。

Taskmaster-1数据集由超过13200个对话样本组成。它和CCPE都是使用《绿野仙踪》(Wizard of Oz)的方法制作的——其中一个人模拟代理,另一个是由临时工人网站上的工人模拟一个普通的数字助理用户。

在最近谷歌对讲人工智能新闻中,谷歌的Euphonia项目引入了对讲人工智能,提高了对口音和ALS患者声音的识别能力。谷歌DeepMind的研究人员与其他人工智能社区利益相关者合作,引入了SuperGLUE基准,以便于开发更强大的对讲人工智能。

参考:https://venturebeat.com/2019/09/06/google-open-sources-datasets-for-ai-assistants-with-human-level-understanding/

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多