所有文章 > 正文

研究人员使用人工神经网络(ANN)和对立人工蜂群(OABC)来优化语音识别准确率

作者: Jansfer

时间: 2019-10-11 11:19

来自印度圣雄甘地特派团工程技术学院和杰比信息技术学院的研究人员开发出一种语音识别系统,使用OABC优化算法来优化ANN的层和人工神经元。

在过去的十年左右的时间里,机器学习的进步为开发越来越先进的语音识别工具铺平了道路。通过分析人类语音的音频文件,这些工具可以学习识别不同语言的单词和短语,并将其转换为机器可读的格式。而尽管几种基于机器学习的模型在语音识别任务上已经取得了可喜的成果,但它们并非总是在所有语言中都表现良好。例如,当一种语言的词汇表中包含许多发音相似的单词时,语音识别系统的性能可能会大大下降。

1-speechrecogn_wps图片.jpg

而来自印度圣雄甘地特派团工程技术学院和杰比信息技术学院的研究人员已经开发出一种语音识别系统来解决这个问题。他们在Springer Link的国际语音技术杂志上发表的一篇论文中介绍了这个新系统,该系统将人工神经网络(ANN)与一种称为对立人工蜂群(OABC)的优化技术相结合。研究人员在论文中写道:“在这项工作中,使用Levenberg-Marquardt算法重新设计了ANN的默认结构,以准确地检索出最佳的预测率。使用对立人工蜂群优化技术进一步优化了隐层和隐层的神经元。”

研究人员开发的系统的独特之处在于它使用OABC优化算法来优化ANN的层和人工神经元。顾名思义,人工蜂群(ABC)算法旨在模拟蜜蜂的行为,以解决各种优化问题。研究人员在论文中解释说:“通常,优化算法会在相匹配的域中随机出一个初始化解决方案。但是这种解决方案可能与最佳解决方案产生截然相反的结果,从而大大增加了计算成本。因此,这种基于对立的初始化被称为对立人工蜂群(OABC)。”

研究人员开发的系统将不同人说的单个单词视为输入语音信号。系统首先要提取所谓的调幅(AM)频谱图特征,这些特征本质上是特定于声音的特征。然后,由模型提取的特征将用于训练ANN以识别人类语音。在大型音频文件数据库上进行训练后,人工神经网络学会预测新的人类语音样本中的孤立词。研究人员在一系列人类语音音频片段上测试了他们的系统,并将其与更传统的语音识别技术进行了比较,比较结果是可喜的:他们的技术优于其他所有方法,获得了显著高于其他方法的准确性得分。研究人员在论文中写道,该方法的灵敏度,特异性和准确性分别为90.41%,99.66%和99.36%,比所有现有方法都要好。将来,语音识别系统可用于在各种环境中实现更有效的人机通信。此外,他们用于开发系统的方法可能会启发其他团队设计类似的模型,这些模型结合了ANN和OABC 优化技术。

参考:https://techxplore.com/news/2019-10-speech-recognition-artificial-neural-networks.html

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多