一种融合自注意力和卷积操作的环境噪声识别方法及系统技术方案

技术编号：37290692 阅读：11 留言：0更新日期：2023-04-21 02:28

本发明专利技术提供了一种融合自注意力和卷积操作的环境噪声识别方法及系统，所述方法包括：获取待分析环境噪声数据；对所述待分析环境噪声数据进行预处理，得到对应的声音频谱图；将所述声音频谱图输入至预先构建的环境噪声识别网络模型进行分类预测，得到对应的声纹识别结果；所述环境噪声识别网络模型包括依次连接的声纹特征提取模块、奇异值分解特征精炼模块、上下文特征提取模块和MLP分类器。本发明专利技术通过设计采用自注意力机制和卷积操作融合对声谱图进行特征提取，采用奇异值分解对声谱图特征进行个性特征筛选，以及结合基于注意力的双向门控循环单元网络进一步提取时序特征的全新声纹识别模型，能有效提高环境噪音识别的鲁棒性、精准性和高效性。精准性和高效性。精准性和高效性。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合自注意力和卷积操作的环境噪声识别方法及系统

[0001]本专利技术涉及声纹识别
，特别是涉及一种融合自注意力和卷积操作的环境噪声识别方法及系统。

技术介绍

[0002]随着城市化进程的发展，噪声污染日益严重，已成为影响城市居民身体健康和生活质量的重要环境因素，对于噪声污染的监测和治理也逐渐成为人们关心的问题。
[0003]最新研究表明，人们对声音的舒适度不仅取决于噪音的分贝数，还取决于噪声源，如铁路、公路、飞机的交通噪声，邻里之间的噪声和工业噪声等对人体健康和生活质量的影响并不相同。因此，忽略噪声源信息仅基于平均时间内加权声压的测量噪声进行监测的方法并不能满足实际应用需求，反之，若能采用声音内容的分类技术来识别噪声源信息及相对应的强度信息，可以更好的了解影响居民日常生活的声音问题，对噪声进行更加有效的评估，便于对症下药，找到精准的声学解决方案，进而极大促进城市噪声的管理，提高居民的城市生活质量。
[0004]现有噪声智能识别方法通常是基于卷积神经网络模型对噪声进行分类识别。尽管卷积神经网络在环境音频的特征提取方面表现不错，但当城市噪声类别增多且背景声复杂时，使用这种将声学信号直接转化成声谱图，再基于声谱图进行图像识别的方式所得到的分类准确率并不高，并且泛化能力也较弱，并不能对复杂多变的城市音频数据进行准确有效的分类识别，也不能为城市噪声管理提供可靠依据，亟需进一步提升和优化。

技术实现思路

[0005]本专利技术的目的是提供一种融合自注意力和卷积操作的环境噪声识别方法，通...

【技术保护点】

【技术特征摘要】
1.一种融合自注意力和卷积操作的环境噪声识别方法，其特征在于，所述方法包括以下步骤：获取待分析环境噪声数据；对所述待分析环境噪声数据进行预处理，得到对应的声音频谱图；将所述声音频谱图输入至预先构建的环境噪声识别网络模型进行分类预测，得到对应的声纹识别结果；所述环境噪声识别网络模型包括依次连接的声纹特征提取模块、奇异值分解特征精炼模块、上下文特征提取模块和MLP分类器。2.如权利要求1所述的融合自注意力和卷积操作的环境噪声识别方法，其特征在于，所述对所述待分析环境噪声数据进行预处理，得到对应的声音频谱图的步骤包括：将所述待分析环境噪声数据进行短时傅立叶变换处理，得到对应的能量谱图；计算所述能量谱图的Delta信息，并采用γ型滤波器对所述能量谱图进行滤波处理，得到γ频谱图；将所述Delta信息和所述γ频谱图串联，得到对数γ频谱图；将所述对数γ频谱图按照预设时间间隔进行分割，得到若干个对数γ频谱分割图；将所述对数γ频谱分割图的分割时序作为第三维次数，并按照第三维次数由小到大的顺序对所述对数γ频谱分割图进行正序排列，得到所述声音频谱图。3.如权利要求1所述的融合自注意力和卷积操作的环境噪声识别方法，其特征在于，所述声纹特征提取模块为ACmix模型；所述上下文特征提取模块包括依次连接的带注意力机制的双向门控循环单元网络和自注意力网络；所述带注意力机制的双向门控循环单元网络包括双向门控循环单元网络和注意力机制模块。4.如权利要求3所述的融合自注意力和卷积操作的环境噪声识别方法，其特征在于，所述将所述声音频谱图输入至预先构建的环境噪声识别网络模型进行分类预测，得到对应的声纹识别结果的步骤包括：将所述声音频谱图输入所述声纹特征提取模块进行基于自注意力和卷积的融合特征提取，得到初始声纹特征；将所述初始声纹特征输入所述奇异值分解特征精炼模块进行特征去冗余处理，得到声纹精炼特征；将所述声纹精炼特征输入所述上下文特征提取模块进行上下文信息提取，得到声纹上下文特征向量；将所述声纹上下文特征向量输入所述MLP分类器进行分类预测，得到所述声纹识别结果。5.如权利要求4所述的融合自注意力和卷积操作的环境噪声识别方法，其特征在于，所述将所述初始声纹特征输入所述奇异值分解特征精炼模块进行特征去冗余处理，得到声纹精炼特征的步骤包括：获取所述初始声纹特征中各个特征图对应的特征矩阵集；对各个特征矩阵集里的各个初始特征矩阵进行奇异值分解，得到对应的主成分特征向量；所述主成分特征向量为所述初始特征矩阵的最大奇异值对应的特征向量；根据所述主成分特...

【专利技术属性】
技术研发人员：郑建辉，
申请(专利权)人：广州声博士声学技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人