语音信号处理方法、装置及设备制造方法及图纸

技术编号：24519266 阅读：33 留言：0更新日期：2020-06-17 07:21

本发明专利技术提供语音信号处理方法、装置及设备，其中，方法包括：获取待处理语音信号对应的第一统计特征向量，所述第一统计特征向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的统计值，所述M为大于1的整数；将所述第一统计特征向量输入第一模型进行处理，获得第二统计特征向量，所述第一模型用于根据所述M维特征空间中每维特征空间的重要程度对所述第一统计特征向量进行处理；根据所述第二统计特征向量，确定所述待处理语音信号的目标类别，所述目标类别包括原始语音信号或者录音重放语音信号。该技术方案可以提高录音重放信号检测的准确性。

Speech signal processing method, device and equipment

全部详细技术资料下载

【技术实现步骤摘要】
语音信号处理方法、装置及设备
本专利技术涉及信号处理领域，尤其涉及语音信号处理方法、装置及设备。
技术介绍
近几年，声纹识别技术在远程无监督身份认证领域中得到了广泛应用。然而在使用中也存在很多安全隐患，比如，录制说话人语音，然后进行录音重放的攻击手段是声纹识别系统面临的最常见的攻击手段，录音重放攻击是一种用高保真录音设备录制目标人物的语音，然后运用录制的语音信号去破解声纹认证系统的技术手段。语音重放攻击的语音是来自说话人本人，因此更具真实性，这种攻击对系统的安全性将造成更大的威胁。目前为了避免录音重放攻击，用户在进行声纹验证时，系统会规定用户需要诵读的文本语句，在进行声纹验证时，辅以语音内容识别进行录音重放检测。然而在用户口音严重或者有自己特殊发音习惯时，语音内容识别准确率大幅下降，降低录音重放语音信号检测的准确性。
技术实现思路
本专利技术实施例提供语音信号处理方法、装置及设备，可以提高录音重放信号检测的准确性，并且不需要对语音信号内容进行检测，提高检测效率。第一方面，提供语音信号处理方...

【技术保护点】
1.一种语音信号处理方法，其特征在于，包括：/n获取待处理语音信号对应的第一统计特征向量，所述第一统计特征向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的统计值，所述M为大于1的整数；/n将所述第一统计特征向量输入第一模型进行处理，获得第二统计特征向量，所述第一模型用于根据所述M维特征空间中每维特征空间的重要程度对所述第一统计特征向量进行处理；/n根据所述第二统计特征向量，确定所述待处理语音信号的目标类别，所述目标类别包括原始语音信号或者录音重放语音信号。/n

【技术特征摘要】
1.一种语音信号处理方法，其特征在于，包括：
获取待处理语音信号对应的第一统计特征向量，所述第一统计特征向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的统计值，所述M为大于1的整数；
将所述第一统计特征向量输入第一模型进行处理，获得第二统计特征向量，所述第一模型用于根据所述M维特征空间中每维特征空间的重要程度对所述第一统计特征向量进行处理；
根据所述第二统计特征向量，确定所述待处理语音信号的目标类别，所述目标类别包括原始语音信号或者录音重放语音信号。

2.如权利要求1所述的方法，其特征在于，所述获取待处理语音信号对应的第一统计特征向量，包括：
将所述待处理语音信号划分为N个语音帧，所述N为大于或者等于1的整数；
获取所述N个语音帧中每个语音帧的第一特征向量，所述第一特征向量用于表示所述语音帧在M维特征空间中每维特征空间的特征值；
针对所述M维特征空间中的每维特征空间，计算该维特征空间对应的统计值，所述统计值为所述N个语音帧在该维特征空间的统计值；
根据所述M维特征空间中每维特征空间对应的统计值，构建所述待处理语音信号对应的第一统计特征向量。

3.如权利要求1或2所述的方法，其特征在于，所述第一统计特征向量包括第一均值向量和/或第一标准差向量，所述第一均值向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的均值，所述第一标准差向量用于表示所述待处理语音信号在M维特征空间中每维特征空间的标准差。

4.如权利要求3所述的方法，其特征在于，若所述第一统计特征向量包括所述第一均值向量和所述第一标准差向量；所述第二统计特征向量包括第二均值向量和第二标准差向量，所述第二均值向量是根据所述第一均值向量和所述第一模型得到，所述第二标准差向量是根据所述第一标准向量和所述第一模型得到；
所述根据所述第二统计特征向量，确定所述待处理语音信号的目标类别，包括：
根据所述第二均值向量和所述第二标准差向量，构建第三统计特征向量；
根据所述第三统计特征向量，确定所述待处理语音信号的目标类别。

5.如权利要求1所述的方法，其特征在于，所述获取待处理语音信号对应的第一统计特征向量之前，还包括：
获取第一样本语音信号对应的第一样本统计特征向量，所述第一样本统计特征向量用于表示所述第一样本语音信号在M维特征空间中每维特征空间的统计值，所述M为大于1的整数，所述第一样本语音信号为录音重放语音信号或者原始语音信号；
将所述第一样本统计特征向量输入所述第一模型进行处理，获得第二样本统计特征向量；
根据所述第二样本统计特征向量，计算所述第一模型的第一损失；
根据所述第一损失，训练所述第一模...

【专利技术属性】
技术研发人员：王健宗，彭俊清，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人