跨信道声纹识别方法及装置制造方法及图纸

技术编号：24858672 阅读：54 留言：0更新日期：2020-07-10 19:10

本发明专利技术公开了一种跨信道声纹识别方法及装置，其中，该方法包括：获取来自第一信道的包含作业指令的用户音频数据；将预处理后的用户音频数据输入至已训练的信道拟合器，以输出无差异音频数据；基于已训练的声纹识别模型，并根据预先存储的验证音频数据对无差异音频数据进行识别，以识别用户身份，其中，验证音频数据来自于第二信道，声纹识别模型由来自所述第二信道的历史音频数据进行训练；响应于所述用户身份识别成功，执行作业指令。通过本发明专利技术，可以可以提高跨信道声纹识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
跨信道声纹识别方法及装置
本专利技术涉及声纹识别领域，具体涉及一种跨信道声纹识别方法及装置。
技术介绍
目前，人工智能技术广泛应用于各领域，尤其是在办公领域中的应用，将大量重复性流程剥离出主要业务流程，可以显著提高办公效率及正确率。在人工智能
中，声纹识别技术正逐渐应用到银行业，典型应用场景为电话银行，电话银行呼叫中心使用声纹识别作为用户身份验证的辅助手段，并基于声纹识别技术搭建声纹黑名单，在抵制电话诈骗的场景下有着广阔的应用空间。声纹识别应用在同信道时效果极佳，识别准确率往往可以达到98％以上，等错率(EER，EqualErrorRate)也能达到0.01以下。在实际应用中，用户通过手机app(应用)注册声纹，再通过呼叫中心咨询业务。在此过程中，银行业务系统使用声纹识别来对用户身份进行认证来保障业务安全。这就涉及到，通过手机app网络信道采集的采样率为16kHz的语音，而通过电话信道采集的采样率为8kHz的语音，这两个语音的比对属于跨信道比对(也就是，跨信道场景)。目前，无论在现实应用中，还是在实验室...

【技术保护点】
1.一种跨信道声纹识别方法，其特征在于，所述方法包括：/n获取来自第一信道的包含作业指令的用户音频数据；/n将预处理后的用户音频数据输入至已训练的信道拟合器，以输出无差异音频数据；/n基于已训练的声纹识别模型，并根据预先存储的验证音频数据对所述无差异音频数据进行识别，以识别用户身份，其中，所述验证音频数据来自于第二信道，所述声纹识别模型由来自所述第二信道的历史音频数据进行训练；/n响应于所述用户身份识别成功，执行所述作业指令。/n

【技术特征摘要】
1.一种跨信道声纹识别方法，其特征在于，所述方法包括：
获取来自第一信道的包含作业指令的用户音频数据；
将预处理后的用户音频数据输入至已训练的信道拟合器，以输出无差异音频数据；
基于已训练的声纹识别模型，并根据预先存储的验证音频数据对所述无差异音频数据进行识别，以识别用户身份，其中，所述验证音频数据来自于第二信道，所述声纹识别模型由来自所述第二信道的历史音频数据进行训练；
响应于所述用户身份识别成功，执行所述作业指令。

2.根据权利要求1所述的方法，其特征在于，通过如下方式训练所述信道拟合器：
获取历史用户的历史验证音频数据，所述历史验证音频数据包括：来自所述第一信道的第一音频数据和来自所述第二信道的第二音频数据；
基于预定相似度信息，根据所述历史验证音频数据和所述声纹识别模型来训练所述信道拟合器。

3.根据权利要求2所述的方法，其特征在于，通过如下方式确定所述预定相似度信息：
将所述第二音频数据作为输入音频数据输入至所述声纹识别模型，以输出音频识别数据；
根据所述音频识别数据和所述输入音频数据之间的相似度确定所述预定相似度信息。

4.根据权利要求3所述的方法，其特征在于，基于预定相似度信息，根据所述历史验证音频数据和所述声纹识别模型来训练所述信道拟合器包括：
将所述第一音频数据输入至所述信道拟合器以输出拟合音频数据；
将所述拟合音频数据输入至所述声纹识别模型，以输出拟合音频识别数据；
更新所述信道拟合器的参数，以使所述拟合音频数据和所述拟合音频识别数据之间的相似度信息与所述预定相似度信息之间的差异小于预定阈值；
响应于所述差异小于预定阈值，确定所述信道拟合器训练完成。

5.根据权利要求1所述的方法，其特征在于，基于已训练的声纹识别模型，并根据预先存储的验证音频数据对所述无差异音频数据进行识别，以识别用户身份包括：
将所述无差异音频数据输入至所述声纹识别模型，以生成无差异音频识别数据；
根据预先存储的验证音频数据对所述无差异音频识别数据进行匹配操作，其中，所述验证音频数据包括：关联的验证音频信息和验证用户信息；
根据匹配结果来识别用户身份。

6.根据权利要求5所述的方法，其特征在于，所述用户音频数据还包括：用户身份信息，所述方法还包括：
根据所述验证音频数据中关联的验证音频信息和验证用户信息对所述无差异音频识别数据中的音频信息和用户身份信息进行匹配操作；
响应于所述音频信息和/或所述用户身份信息未匹配成功，则所述用户身份识别失败。

7.一种跨信道声纹识别装置，其特征在于，所述装置包括：
数据获取单元，用于获取来自第一信道的包含作业指令的用户音频数据；
拟合单元，用于将预处理后的用户音频数据输入至已训练的信道拟合器，以输出无差异音频数据；
识别单元，用于基于已训练的声纹识别模型，并根据预先存储的验证音频数据对所述无差异音频数据进行识别，以识别用户身份，其...

【专利技术属性】
技术研发人员：吕楠楠，宁博，巫昌凯，张松，
申请(专利权)人：中国工商银行股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人