一种音频分类识别方法、系统、计算机及可读存储介质技术方案

技术编号:37421515 阅读:25 留言:0更新日期:2023-04-30 09:43
本发明专利技术提供了一种音频分类识别方法、系统、计算机及可读存储介质,方法包括获取音频的训练音频数据与分类音频数据;对训练音频数据与分类音频数据进行预处理;分别对第一梅尔频谱图与第二梅尔频谱图进行语义分割重组;分别对第一频谱特征与第二频谱特征分别进行多维度卷积降维处理;第一降维特征输入预设CNN神经网络识别模型中进行训练,将第二降维特征输入预设CNN神经网络识别模型进行分类识别,以输出与分类音频数据对应的分类标签。本发明专利技术通过对梅尔频谱图进行语义分割重组,以提高模型分类的准确性,同时采用多维度卷积降维的方式对频谱特征进行处理,以进一步提高模型分类的准确性。的准确性。的准确性。

【技术实现步骤摘要】
一种音频分类识别方法、系统、计算机及可读存储介质


[0001]本专利技术属于音频分类的
,具体地涉及一种音频分类识别方法、系统、设备及可读存储介质。

技术介绍

[0002]音频指能被人体感知的声音频率,定义为20

20000HZ的身音。声音是通过物体振动产生的声波。是通过介质(空气或固体、液体)传播并能被人或动物听觉器官所感知的波动现象。
[0003]在一般的声学场景中,声学场景中一段时间可以定义为一个语义,当声学场景具有随机性,即在一个声学场景中会出现不同内容、含义的语义,且声学场景也具有连续性,即相同或相似的语义可在短期内重复多次出现,进而导致在对音频进行分类的过程中,分类模型无法很好的运用声学场景的语义信息,且声学场景中的噪音会影响音频数据导致音频数据的鲁棒性不强,进而导致在分类模型进行音频分类时其准确率较低,影响其最终分类结果。
[0004]同时现有技术中大多单独采用二维卷积对音频信息进行处理,但由于卷积具有平移不变形的特点,即声音在频谱图上不具备分层的特点,且频谱图上所观察到的频率可能不属于一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频分类识别方法,其特征在于,所述方法包括:获取训练音频数据与分类音频数据,所述训练音频数据包括训练音频以及与所述训练音频对应的分类标签;对所述训练音频数据与所述分类音频数据进行预处理,以分别得到所述训练音频数据的第一梅尔频谱图与所述分类音频数据的第二梅尔频谱图;分别对所述第一梅尔频谱图与所述第二梅尔频谱图进行语义分割重组,以得到第一频谱特征与第二频谱特征;分别对所述第一频谱特征与所述第二频谱特征分别进行多维度卷积降维处理,以得到第一降维特征与第二降维特征,并对所述第一降维特征与所述第二降维特征进行归一化处理;将归一化之后的第一降维特征以及对应的分类标签输入预设CNN神经网络识别模型中对所述预设CNN神经网络识别模型进行训练,将归一化之后的第二降维特征输入训练后的所述预设CNN神经网络识别模型进行分类识别,以输出与所述分类音频数据对应的分类标签。2.根据权利要求1所述的音频分类识别方法,其特征在于,所述对所述训练音频数据与所述分类音频数据进行预处理的步骤包括:依次对所述训练音频数据与所述分类音频数据进行预加重、分帧、加窗、离散傅里叶变换、梅尔滤波组过滤。3.根据权利要求1所述的音频分类识别方法,其特征在于,所述分别对所述第一梅尔频谱图与所述第二梅尔频谱图进行语义分割重组,以得到第一频谱特征与第二频谱特征的步骤包括:将所述第一梅尔频谱图与所述第二梅尔频谱图在时间方向上进行顺序分割,以分别得到第一频谱语义片段组与第二频谱语义片段组;分别获取所述第一频谱语义片段组中的第一片段数量以及所述第二频谱语义片段组中的第二片段数量;基于所述第一片段数量与第二片段数量分别建立第一排序组与第二排序组,其中所述第一排序组和所述第二排序组中的元素数量分别与所述第一片段数量和第二片段数量相同;根据所述第一排序组与所述第二排序组将所述第一频谱语义片段组与所述第二频谱语义片段组进行语义重组,以得到第一频谱特征与第二频谱特征。4.根据权利要求3所述的音频分类识别方法,其特征在于,所述根据所述第一排序组与所述第二排序组将所述第一频谱语义片段组与所述第二频谱语义片段组进行语义重组,以得到第一频谱特征与第二频谱特征的步骤包括:对所述第一排序组与所述第二排序组中的元素进行随机排序,以得到第一随机排序组与第二随机排序组;将所述第一频谱语义片段组中语义片段按照所述第一随机排序组的排序关系进行索引排序,以得到第一排序语义片段组,将所述第二频谱语义片段组中语义片段按照所述第二随机排序组的排序关系进行索引排序,以得到第二排序语义片段组;将所述第一排序语义片段组与所述第二排序语义片段组在语义维度上进行语义拼接,
以得到第一频谱特征与第二频谱特征。5.根据权利要求1所述的音频分类识别方法,其特征在于,所述分别对所述第一频谱特征与所述第二频谱特征分别进行多维度卷积降维处理,以得到第一降维特征与第二降维特征的步骤包括:分别对所述第一频谱特征与所述第二频谱特征进行两次二维卷积特征提取,以得到第一高维频谱特征与第二高维频谱特征;将所述第一高维频谱特征与所述第二高维频谱特征在时间维度与频率...

【专利技术属性】
技术研发人员:邱晓健连峰邱正峰崔韧吴鼎元
申请(专利权)人:南昌航天广信科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1