所有文章 > 正文

Apple的语音模型使Siri匹配命令与域名的能力大幅提高

作者: Jansfer

时间: 2019-09-09 17:34

Cupertino公司于今年六月份推出了Apple的语音助手的一种新型语音模型,该模型能够在不使用样本的情况下提供更加自然的声音。

apple 的语音模型使siri匹配命令与域名的能力大幅提高.png

Cupertino公司于今年六月份推出了Apple的语音助手的一种新型语音模型,该模型能够在不使用样本的情况下提供更加自然的声音。这种语音模型主要采用了一种Siri域分类器选择训练数据的方法,该模块选择用户命令仅与他们的日历相关,这意味着在可以在极大程度上降低误差。相关研究发表在Arxiv.杂志上。

Siri使用域选择器来处理语音,从而推断出所需要的区域,这有助于识别既定用户的意图。一旦话语匹配定义超过60个域,Statistical Parser组件将为语音的每个部分分配一个解析标签,之后域选择器和统计分析器预测的域和解析标签将映射到对应的意图命令,该命令将启动相应的操作。Domain Chooser域选择器是由7个双向长短时记忆(bi-LSTM)网络组成的多类系统,是一种能够学习长期依赖关系的人工智能模型。因此,“教导”他们识别新域的语音或更准确地对已知域进行分类需要高质量的训练数据,这又需要缓慢且昂贵的人工注释。该论文提倡一种主动学习技巧,通过使用分类器的集成,它们可以识别现有分类器学习的边界(输出标签不明确的问题空间的区域)附近标记错误的数据样本,从而使在新数据上学习到的边界更加清晰。

apple 的语音模型使siri匹配命令与域名的能力大幅提高2.png

Siri已经允许从错误报告、质量保证团队测试和暗示请求没有被正确解释的用户行为中发现预测错误(例如,快速暂停一首歌或退出Siri推出的应用程序),但研究人员指出,这些错误相对较少。为了扩展该组假设预测误差,他们建议在未标记数据池中找到类似于已确认预测误差的示例,并使人工注释器分配正确的标签并将结果添加到原始训练数据。在第一个实验中,论文的作者从之前用于调试Siri的开发集中随机选择了85万条语音,并从他们的方法中获得了2万条带有训练数据标签的语音。他们用这个语料库来训练定义域选择器,经过11次测试,定义域选择器的错误率降低了8.88%,只有2.3%的原始数据被替换为新的例子。

apple 的语音模型使siri匹配命令与域名的能力大幅提高3.png

在该文中,研究人员提出了一种简单有效的方法,为领域选择器分类器高效地发现有用的训练数据,这作为Siri的一部分,可以减少人工注释的时间,提高质量。尽管该技术是在商业智能助理的环境中开发和测试的,但它具有广泛的适用性。

在经历了长时间的停滞之后,苹果加大了对Siri功能的扩展力度,同时提高了Siri的整体性能。本周,一位承包商表示,该公司正在研究新一代语音助手,这将使Siri能够“就健康问题进行反复讨论”并提供集成的机器翻译功能。另外,Apple正在扩展Siri在iOS 13中的功能,使Apple Watch能够更好地访问数字助理的Shazam,Find My和App Store搜集功能,并使HomePod智能扬声器能够根据别的设备上的语音命令在另一台Siri设备上启动。

参考:https://venturebeat.com/2019/09/07/apple-researchers-improve-siris-ability-to-match-commands-with-domains/

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多