【技术实现步骤摘要】
一种基于深度学习的声纹识别方法及系统
本专利技术涉及故障识别
,尤其涉及一种基于深度学习的声纹识别方法及系统。
技术介绍
随着物联网万物互联的时代的飞速发展,所有的设备都有两个组成部分:电子件加机械件。几乎所有的电子件已经联网和实现数据采集,机械件的万物互联目前还是空白,而成本最低的针对机械件的状态数据采集和传输方式就是通过非接触式的声音采集和识别。传统的语音识别的声学模型训练,对于每一帧的数据,需要知道对应的label才能进行有效的训练,在训练数据之前需要做语音对齐的预处理。而语音对齐的过程本身就需要进行反复多次的迭代,来确保对齐更准确,非常耗时。
技术实现思路
本专利技术的目的在于提供一种基于深度学习的声纹识别方法及系统,从而解决现有技术中存在的前述问题。为了实现上述目的,本专利技术采用的技术方案如下:一种基于深度学习的声纹识别方法,所述识别方法包括如下步骤,S1、声波采集,以麦克风阵列的方式通过近场模型和远场模型,接收声波;S2、声波定位,以麦克风阵列的 ...
【技术保护点】
1.一种基于深度学习的声纹识别方法,其特征在于:所述识别方法包括如下步骤,/nS1、声波采集,以麦克风阵列的方式通过近场模型和远场模型,接收声波;/nS2、声波定位,以麦克风阵列的听声辩位的方式识别机械件的位置;/nS3、声波识别,以CTC解码算法的方式识别机械件;/nS4、声波学习,通过RNN深度学习算法模型挖掘并学习机械件发出声波所反映的故障或者机械属性。/n
【技术特征摘要】
1.一种基于深度学习的声纹识别方法,其特征在于:所述识别方法包括如下步骤,
S1、声波采集,以麦克风阵列的方式通过近场模型和远场模型,接收声波;
S2、声波定位,以麦克风阵列的听声辩位的方式识别机械件的位置;
S3、声波识别,以CTC解码算法的方式识别机械件;
S4、声波学习,通过RNN深度学习算法模型挖掘并学习机械件发出声波所反映的故障或者机械属性。
2.根据权利要求1所述的基于深度学习的声纹识别方法,其特征在于:步骤S1具体为,根据声源到麦克风阵列中心的距离,判断声波的声场模型是近场模型振动或远场模型振动,并根据判断结果通过近场麦克风阵列均匀线阵模型或远场麦克风阵列均匀线阵模型,接收声波;近场模型振动将声波模拟呈球面波,与麦克风阵元接收信号间的幅度差有关;远场模型振动将声波模拟成平面波,与麦克风阵元接收信号间的幅度差无关;均匀线性阵列相邻阵元之间的距离通过下式计算获取
D=n×d
其中,D为均匀线性阵列相邻阵元之间的距离;n为阵列间距个数;d为声源最高频率;由于声源的最小波长为λmin,当声源到阵列中心的距离大于2D2/λmin,则判定声波的声场模型为远场模型,否则,判定声波的声场模型为近场模型。
3.根据权利要求2所述的基于深度学习的声纹识别方法,其特征在于:所述近场麦克风阵列均匀线阵模型为
其中,N为声源个数;M为麦克风阵元个数;c为常温下声波传播速度,为344m/s;rm为声源到第m个麦克风阵元的距离参数;dm为第m个麦克风阵元到阵列中心的距离;sN(t)为i个振动信号到第k个阵元信号的距离;nM(t)为消耗的时间;N<M;
所述远场麦克风阵列均匀线阵模型为
其中,N为声源个数;M为麦克风阵元个数;A(ω)为M×N纬矩阵;N>M。
4.根据权利要求3所述的基于深度学习的声纹识别方法,其特征在于:所述步骤S2中,所述听声辨位的方式为稀疏分解方法或MUSIC算法。
5.根据权利要求4所述的基于深度学习的声纹识别方法,其特征在于:步骤S3具体为,
S31、将所有的声波信息集合起来组成训练集合,所述训练集合表示为S={(x1,z1),(x2,z2),...(xN,zN)},N表示训练样本的个数,xN是输入的训练样本,zN表示训练样本对应的真实输出标签,当输入的训练样本为序列时,输出的标签也是序列,输入的序列长度大于输出的序列长度;
S32、对于训练几个中的其中一个样本(xN,zN),其中,x=(x1,x2,x3,...,xT)表示一个长度为T帧的数据,每一帧的数据是一个维度为m的向量,即每个xi∈Rm,xi表示输入的声波信息,每30ms作为一帧数据信息,其中第ii帧的数据经过MFCC...
【专利技术属性】
技术研发人员:徐立,王旭敏,王冰莹,李丽仙,
申请(专利权)人:中国科学院空间应用工程与技术中心,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。