【技术实现步骤摘要】
一种语音鉴别方法、终端设备及存储介质
[0001]本专利技术涉及语音识别领域,尤其涉及一种语音鉴别方法、终端设备及存储介质。
技术介绍
[0002]随着科技的发展和智能设备的普及,司法鉴定领域的手段也在不断地丰富,从最初的指纹、发展到DNA、到最近的图像识别,自动识别技术正逐渐取代人为识别,但是目前声纹在我国仍以人为识别为主,通过模拟观察固定字母发音的共振峰来识别是否属于同一个人,这种方式的主要原因在于目前声纹模型泛化能力不足,预先训练好的模型不足以支撑司法鉴定所需要的准确率,如果采用针对每个案件重新训练模型需要的数据量巨大,可行性几乎为零。
技术实现思路
[0003]为了解决上述问题,本专利技术提出了一种语音鉴别方法、终端设备及存储介质。
[0004]具体方案如下:
[0005]一种语音鉴别方法,包括以下步骤:
[0006]S1:采集多个信道对应的经过预训练的多个声纹模型;
[0007]S2:采集与待检测语音相同信道的语音数据,并划分为训练集、测试集和校准集;
[00 ...
【技术保护点】
【技术特征摘要】
1.一种语音鉴别方法,其特征在于,包括以下步骤:S1:采集多个信道对应的经过预训练的多个声纹模型;S2:采集与待检测语音相同信道的语音数据,并划分为训练集、测试集和校准集;S3:依次对S1中的各声纹模型进行模型性能判定,将满足要求的声纹模型作为鉴定模型,进入S5,当S1中所有各声纹模型均不满足要求时,进入S4;步骤S3具体包括以下步骤:S301:选择S1中的一个声纹模型;S302:将测试集放入S3选择的声纹模型后,评估该声纹模型在该测试集上的性能效果,根据性能指标是否满足要求来确定该声纹模型是否可用;性能指标的要求包括Tippett图分布满足要求和校验对数似然比cllr<0.2;当Tippett图分布不满足要求时,返回S301重新选择声纹模型,直至所有声纹模型全部选择完毕后,进入S4;当Tippett图分布满足要求时,进入S303;S303:判断是否满足cllr<0.2,如果是,将该声纹模型作为鉴定模型,进入S5;否则,通过校准集对该声纹模型进行分数校准;S304:判断校准后的声纹模型是否满足cllr<0.2,如果是,将校准后的声纹模型作为鉴定模型,进入S5;否则,返回S3重新选择模型,直至所有声纹模型全部选择完毕后,进入S4;S4:提取所有cllr值小于阈值的声纹模型,并通过训练集对提取的各声纹模型进行PLDA在线训练,并对PLDA在线训练后的模型进行模型...
【专利技术属性】
技术研发人员:刘焕玉,肖龙源,李稀敏,叶志坚,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。