一种语音鉴别方法、终端设备及存储介质技术

技术编号:37432645 阅读:39 留言:0更新日期:2023-05-05 19:47
本发明专利技术涉及一种语音鉴别方法、终端设备及存储介质,该方法中包括:S1:采集多个信道对应的经过预训练的多个声纹模型;S2:采集与待检测语音相同信道的语音数据,并划分为训练集、测试集和校准集;S3:依次对S1中的各声纹模型进行模型性能判定,将满足要求的声纹模型作为鉴定模型,进入S5,当S1中所有各声纹模型均不满足要求时,进入S4;S4:提取所有cllr值小于阈值的声纹模型,并通过训练集对提取的各声纹模型进行PLDA在线训练,并对PLDA在线训练后的模型进行模型性能判定,直至找到满足要求的声纹模型作为鉴定模型后进入S5;S5:通过鉴定模型对待检测语音与样本是否属于同一人进行判别。本发明专利技术采用了分数校准和场景适应训练,使得准确率有保障。确率有保障。确率有保障。

【技术实现步骤摘要】
一种语音鉴别方法、终端设备及存储介质


[0001]本专利技术涉及语音识别领域,尤其涉及一种语音鉴别方法、终端设备及存储介质。

技术介绍

[0002]随着科技的发展和智能设备的普及,司法鉴定领域的手段也在不断地丰富,从最初的指纹、发展到DNA、到最近的图像识别,自动识别技术正逐渐取代人为识别,但是目前声纹在我国仍以人为识别为主,通过模拟观察固定字母发音的共振峰来识别是否属于同一个人,这种方式的主要原因在于目前声纹模型泛化能力不足,预先训练好的模型不足以支撑司法鉴定所需要的准确率,如果采用针对每个案件重新训练模型需要的数据量巨大,可行性几乎为零。

技术实现思路

[0003]为了解决上述问题,本专利技术提出了一种语音鉴别方法、终端设备及存储介质。
[0004]具体方案如下:
[0005]一种语音鉴别方法,包括以下步骤:
[0006]S1:采集多个信道对应的经过预训练的多个声纹模型;
[0007]S2:采集与待检测语音相同信道的语音数据,并划分为训练集、测试集和校准集;
[0008]S3:依次对S本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音鉴别方法,其特征在于,包括以下步骤:S1:采集多个信道对应的经过预训练的多个声纹模型;S2:采集与待检测语音相同信道的语音数据,并划分为训练集、测试集和校准集;S3:依次对S1中的各声纹模型进行模型性能判定,将满足要求的声纹模型作为鉴定模型,进入S5,当S1中所有各声纹模型均不满足要求时,进入S4;步骤S3具体包括以下步骤:S301:选择S1中的一个声纹模型;S302:将测试集放入S3选择的声纹模型后,评估该声纹模型在该测试集上的性能效果,根据性能指标是否满足要求来确定该声纹模型是否可用;性能指标的要求包括Tippett图分布满足要求和校验对数似然比cllr<0.2;当Tippett图分布不满足要求时,返回S301重新选择声纹模型,直至所有声纹模型全部选择完毕后,进入S4;当Tippett图分布满足要求时,进入S303;S303:判断是否满足cllr<0.2,如果是,将该声纹模型作为鉴定模型,进入S5;否则,通过校准集对该声纹模型进行分数校准;S304:判断校准后的声纹模型是否满足cllr<0.2,如果是,将校准后的声纹模型作为鉴定模型,进入S5;否则,返回S3重新选择模型,直至所有声纹模型全部选择完毕后,进入S4;S4:提取所有cllr值小于阈值的声纹模型,并通过训练集对提取的各声纹模型进行PLDA在线训练,并对PLDA在线训练后的模型进行模型...

【专利技术属性】
技术研发人员:刘焕玉肖龙源李稀敏叶志坚
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1