声音识别模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37353462 阅读：27 留言：0更新日期：2023-04-27 07:04

本公开提出了一种声音识别模型的训练方法、装置、电子设备及存储介质，涉及声音识别技术领域，该方法包括：获取声音训练样本和待训练的声音识别模型；对声音训练样本基于预设窗长进行处理，以获取声音训练样本的对数梅尔时频谱；将对数梅尔时频谱输入至声音识别模型中进行训练，以获取训练后的声音识别模型。通过使用不同长度的时间窗对训练样本进行处理，在进行特征提取的时候既捕捉声信号中长时程的稳态特征，又能捕捉瞬时精细的信号变化，可以增加声音识别的准确性，同时可以适用于不同的环境，提升本方案的实用性。提升本方案的实用性。提升本方案的实用性。

全部详细技术资料下载

【技术实现步骤摘要】
声音识别模型的训练方法、装置、电子设备及存储介质

[0001]本公开涉及声音识别
，尤其涉及一种声音识别模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]煤岩识别即用一种方法自动识别出煤岩对象为煤或岩石，煤矿设备的工作音频与其机械结构、工作状态密切相关，是分析设备运行状态的一项重要指标，当设备的零件或部件由于作业后状态发生变化，其声纹信号特性也会相应发生变化，基于声纹的监测手段用于采煤机工作的煤岩识别技术具有重要意义。
[0003]当前技术中的煤岩识别方法仅适用于带有记忆截割功能的采煤机设备，可用于较平整的采集工作环境，对于较复杂的环境与其它采煤机设备不具有适用性，识别技术的准确率和效率也会受实际工作环境影响。

技术实现思路

[0004]本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此，本公开的一个目的在于提出一种声音识别模型的训练方法。
[0006]本公开的第二个目的在于提出一种声音识别模型的训练装置。
[0007]本公开的第三...

【技术保护点】

【技术特征摘要】
1.一种声音识别模型的训练方法，其特征在于，包括：获取声音训练样本和待训练的声音识别模型；对所述声音训练样本基于预设窗长进行处理，以获取所述声音训练5样本的对数梅尔时频谱；将所述对数梅尔时频谱输入至所述声音识别模型中进行训练，以获取训练后的声音识别模型。2.根据权利要求1所述的方法，其特征在于，所述对所述声音训0练样本基于预设窗长进行处理，以获取所述声音训练样本的对数梅尔时频谱，包括：对所述声音训练样本基于预设窗长，进行短时傅立叶变换，以获取所述声音训练样本的时频谱；基于所述时频谱和预设的梅尔滤波器，获取所述声音训练样本的对5数梅尔时频谱。3.根据权利要求2所述的方法，其特征在于，所述基于所述时频谱和预设的梅尔滤波器，获取所述声音训练样本的对数梅尔时频谱，包括：0将所述时频谱与所述梅尔滤波器进行点乘，以获取梅尔时频谱；基于所述梅尔时频谱进行对数运算，以获取所述对数梅尔时频谱。4.根据权利要求1
‑
3中任一项所述的方法，其特征在于，所述将所述对数梅尔时频谱输入至所述声音识别模型中进行训练，包括：对不同预设窗长的对数梅尔时频谱进行采样处理，以获取同一维度下的多通道信号；将所述多通道信号输入至所述声音识别模型中进行训练。5.根据权利要求4所述的方法，其特征在于，所述对不同预设窗长的对数梅尔时频谱进行采样处理，以获取同一维度下的多通道信号，包括：对所述对不同预设窗长的对数梅尔时频谱进行上采样，以实现将...

【专利技术属性】
技术研发人员：曹宁宁，高思伟，王峰，冯银辉，李再峰，贺鹏，王帅，郑闯，刘姗姗，
申请(专利权)人：北京煤科天玛自动化科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人