所有文章 > 正文

谷歌最新设计的AI产品能更好地为ALS人群和带口音的人群进行服务

作者: Jansfer

时间: 2019-08-17 09:01

8月16日,与肌萎缩性脊髓侧索硬化症治疗发展研究所(ALS Therapy Development Institute)合作的谷歌人工智能研究人员分享了关于项目Euphonia的详细信息,即一种针对有语言障碍的人的语音到文本转录服务。

44r.png

图片来源:Reuters / Charles Platiau

8月16日,与肌萎缩性脊髓侧索硬化症治疗发展研究所(ALS Therapy Development Institute)合作的谷歌人工智能研究人员分享了关于项目Euphonia的详细信息,即一种针对有语言障碍的人的语音到文本转录服务。

这种新方法之所以成功,主要是因为引入了能代表肌萎缩性侧索硬化症患者口音的少量数据。由于现有的人工智能系统通常是根据那些没有任何语音困难或口音的人的语音数据进行训练的,患有肌萎缩侧索硬化症(ALS)的人常常说话含糊不清,因此现有的人工智能系统通常无法适用于ALS人群。

在7月31日发表的文章中,研究人员表示仅仅五分钟的训练数据就使这种文本服务的准确率改善了71%,对ALS和口音的相对错误率分别改善了62%和35%。实验所用的ALS语音数据集来自于67名ALS患者的36小时音频,口音的数据集被称为L2 Arctic,它来自以英文之外的其他语言为母语的人群。由于数据集的准确性和代表性,这种新方法才能取得成功。

除了使用微调技术外,Euphonia项目还利用了今年7月推出的一款专为有语言障碍的人设计人工智能工具,即Parrotron的技术。

这篇论文由12学者共同撰写,将于9月15日至19日在奥地利格拉茨举行的国际语言交流协会或Interspeech 2019上发表。此外,谷歌正在收集更多ALS患者的数据以提高系统的准确性,使用音素错误来降低单词错误率,为Euphonia项目进行更进一步的完善。

(参考来源:venturebeat.com)

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多