基于声纹的身份验证方法和装置制造方法及图纸

技术编号：18459724 阅读：26 留言：0更新日期：2018-07-18 13:04

本发明专利技术涉及基于声纹的身份验证方法和装置。该方法包括：一种基于声纹的身份验证方法，包括：接收未知语音；利用预先训练得到的基于神经网络的声纹提取器来提取所述未知语音中的声纹；将所提取的声纹与预先存储的声纹进行拼接得到拼接的声纹；以及利用预先训练的分类模型对所述拼接的声纹进行判断，验证所提取的声纹与预先存储的声纹是否来自同一个人。根据本发明专利技术的身份验证方法和装置,可以从较短的语音中提取说话者的全息声纹，使得验证结果更加鲁棒。

Authentication method and device based on sound pattern

The invention relates to voiceprint based authentication methods and devices. The method includes: an authentication method based on sound lines, including receiving unknown speech; using a sound pattern extractor based on neural networks trained in advance to extract the voiceprint in the unknown voice; splicing the extracted sound lines with the pre stored sound lines to the stitching stitching; and using pre training. The classification model of the training is used to judge the stitching of the voiceprint, and verify whether the extracted voiceprint and the pre stored voiceprint are from the same person. According to the authentication method and device of the invention, the speaker's hologram can be extracted from the shorter speech, so that the verification result is more robust.

全部详细技术资料下载

【技术实现步骤摘要】
基于声纹的身份验证方法和装置
本专利技术涉及语音处理领域，更具体地涉及一种基于声纹的身份验证方法和装置。
技术介绍
声纹已在许多领域有着广泛的应用，包括用户接口，国土安全，电话银行等。传统的方法通过联合因子分析(jointfactoranalysis)将语音片段映射到某空间，得到一种i-vector作为声纹。但是这种方法有两种缺陷：1，为了得到满意的性能，必须采用较长(20-30秒)的语音段来提取i-vector；2，说话者的其他信息，例如年龄、性别、语种信息是有助于身份确认的，但是目前这种框架没有办法或者很难加入说话者的其他信息。因此，希望提供一种能够基于较短的、包含说话者的多种信息的声纹来进行身份验证的方法和装置。
技术实现思路
在下文中给出关于本专利技术的简要概述，以便提供关于本专利技术的某些方面的基本理解。应当理解，这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分，也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。本专利技术的一个主要目的在于，提供了一种基于声纹的身份验证方法，包括：接收未知语音；利用预先训练得到的基于神经网络的声纹提取器来提取所述未知语音中的声纹；将所提取的声纹与预先存储的声纹进行拼接得到拼接的声纹；以及利用预先训练的分类模型对所述拼接的声纹进行判断，验证所提取的声纹与预先存储的声纹是否来自同一个人。根据本专利技术的一个方面，提供一种基于声纹的身份验证装置，包括：语音接收单元，被配置为接收未知语音；声纹提取单元，被配置为利用预先训练得到的基于神...

【技术保护点】
1.一种基于声纹的身份验证方法，包括：接收未知语音；利用预先训练得到的基于神经网络的声纹提取器来提取所述未知语音中的声纹；将所提取的声纹与预先存储的声纹进行拼接得到拼接的声纹；以及利用预先训练的分类模型对所述拼接的声纹进行判断，验证所提取的声纹与预先存储的声纹是否来自同一个人。

【技术特征摘要】
1.一种基于声纹的身份验证方法，包括：接收未知语音；利用预先训练得到的基于神经网络的声纹提取器来提取所述未知语音中的声纹；将所提取的声纹与预先存储的声纹进行拼接得到拼接的声纹；以及利用预先训练的分类模型对所述拼接的声纹进行判断，验证所提取的声纹与预先存储的声纹是否来自同一个人。2.根据权利要求1所述的身份验证方法，其中，通过下述步骤来训练得到基于神经网络的声纹提取器：采集来自不同说话者的语音；将说话者的辅助信息作为神经网络的分组标签进行标记，将标记过的语音作为训练样本输入神经网络；以及进行深度学习来得到所述基于神经网络的声纹提取器。3.根据权利要求2所述的身份验证方法，其中，所述说话者的辅助信息包括：说话者的语种、音素序列、发声通道、情感、年龄、生活区域以及性别中的一项或多项。4.根据权利要求2所述的身份验证方法，其中，进行深度学习来得到所述基于神经网络的声纹提取器包括：采用层次神经网络将不同的分组标签分别放置在不同层进行深度学习得到层次网络提取器；以及采用扁平神经网络将全部分组标签放置在输出层进行深度学习得到扁平网络提取器。5.根据权利要求4所述的身份验证方法，其中，利用预先训练得到的基于神经网络的声纹提取器来提取所述未知语音中的声纹的步骤包括：分别利用所述层次网络提取器和所述扁平网络提取器提取来提取所述未知语音中的声纹；以及将所述层次网络提取器所提取的声纹和所述扁平网络提取器所提取的声纹拼接在一起作为所提取的所述未知语音中的声纹。6.根据权利要求4所述的身份验证方法，其中，所述分组标签...

【专利技术属性】
技术研发人员：石自强，刘柳，刘汝杰，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人