基于配对特征融合的声学场景分类方法

Shen Xinhao, Chen Jiaye,Song Xiaoning

Application Research of Computers(2023)

引用 0|浏览1
暂无评分
摘要
在近些年的研究中,单设备的声音场景分类已经取得不错的效果,然而多设备声音场景分类的进展缓慢.为了解决多设备分类时样本数量差异大的问题,提出了一种配对特征融合算法.通过计算每一对配对样本在频谱图上的差异,将这些差异累加后取平均,可以获得各个设备的平均频谱特征,用于设备样本的转换.该算法在增加设备样本数量的同时有效提升了模型的泛化能力.同时,为了获取全局信息,提出了一种轻量级注意力模块,通过对输入特征在频域上压缩后进行自注意力操作,可以在减少计算量的基础上使模型专注于整个声音序列信息的训练,实验结果表明所提算法在模型大小和分类精度方面与其他方法相比具有较好的优势.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要