一种语音鉴别方法、终端设备及存储介质技术

技术编号：37432645 阅读：39 留言：0更新日期：2023-05-05 19:47

本发明专利技术涉及一种语音鉴别方法、终端设备及存储介质，该方法中包括：S1：采集多个信道对应的经过预训练的多个声纹模型；S2：采集与待检测语音相同信道的语音数据，并划分为训练集、测试集和校准集；S3：依次对S1中的各声纹模型进行模型性能判定，将满足要求的声纹模型作为鉴定模型，进入S5，当S1中所有各声纹模型均不满足要求时，进入S4；S4：提取所有cllr值小于阈值的声纹模型，并通过训练集对提取的各声纹模型进行PLDA在线训练，并对PLDA在线训练后的模型进行模型性能判定，直至找到满足要求的声纹模型作为鉴定模型后进入S5；S5：通过鉴定模型对待检测语音与样本是否属于同一人进行判别。本发明专利技术采用了分数校准和场景适应训练，使得准确率有保障。确率有保障。确率有保障。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音鉴别方法、终端设备及存储介质

[0001]本专利技术涉及语音识别领域，尤其涉及一种语音鉴别方法、终端设备及存储介质。

技术介绍

[0002]随着科技的发展和智能设备的普及，司法鉴定领域的手段也在不断地丰富，从最初的指纹、发展到DNA、到最近的图像识别，自动识别技术正逐渐取代人为识别，但是目前声纹在我国仍以人为识别为主，通过模拟观察固定字母发音的共振峰来识别是否属于同一个人，这种方式的主要原因在于目前声纹模型泛化能力不足，预先训练好的模型不足以支撑司法鉴定所需要的准确率，如果采用针对每个案件重新训练模型需要的数据量巨大，可行性几乎为零。

技术实现思路

[0003]为了解决上述问题，本专利技术提出了一种语音鉴别方法、终端设备及存储介质。
[0004]具体方案如下：
[0005]一种语音鉴别方法，包括以下步骤：
[0006]S1：采集多个信道对应的经过预训练的多个声纹模型；
[0007]S2：采集与待检测语音相同信道的语音数据，并划分为训练集、测试集和校准集；
[00...

【技术保护点】

【技术特征摘要】
1.一种语音鉴别方法，其特征在于，包括以下步骤：S1：采集多个信道对应的经过预训练的多个声纹模型；S2：采集与待检测语音相同信道的语音数据，并划分为训练集、测试集和校准集；S3：依次对S1中的各声纹模型进行模型性能判定，将满足要求的声纹模型作为鉴定模型，进入S5，当S1中所有各声纹模型均不满足要求时，进入S4；步骤S3具体包括以下步骤：S301：选择S1中的一个声纹模型；S302：将测试集放入S3选择的声纹模型后，评估该声纹模型在该测试集上的性能效果，根据性能指标是否满足要求来确定该声纹模型是否可用；性能指标的要求包括Tippett图分布满足要求和校验对数似然比cllr<0.2；当Tippett图分布不满足要求时，返回S301重新选择声纹模型，直至所有声纹模型全部选择完毕后，进入S4；当Tippett图分布满足要求时，进入S303；S303：判断是否满足cllr<0.2，如果是，将该声纹模型作为鉴定模型，进入S5；否则，通过校准集对该声纹模型进行分数校准；S304：判断校准后的声纹模型是否满足cllr<0.2，如果是，将校准后的声纹模型作为鉴定模型，进入S5；否则，返回S3重新选择模型，直至所有声纹模型全部选择完毕后，进入S4；S4：提取所有cllr值小于阈值的声纹模型，并通过训练集对提取的各声纹模型进行PLDA在线训练，并对PLDA在线训练后的模型进行模型...

【专利技术属性】
技术研发人员：刘焕玉，肖龙源，李稀敏，叶志坚，
申请(专利权)人：厦门快商通科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人