声纹识别训练数据扩增方法、系统、移动终端及存储介质技术方案

技术编号：24689968 阅读：50 留言：0更新日期：2020-06-27 09:50

本发明专利技术提供了一种声纹识别训练数据扩增方法、系统、移动终端及存储介质，该方法包括：获取纯净原始语音进行加噪处理，得到至少一个加噪语音；将纯净原始语音与加噪语音进行混合，以得到混合语音，采用至少两种编码方式对混合语音进行编码，得到编码数据；将编码数据通过至少两个信道进行传输，以得到语音传输数据，对语音传输数据进行解码，以得到语音解码数据；将混合语音与语音解码数据进行匹配，并根据匹配结果将混合语音中的语音信息与语音解码数据中解码信息对应进行存储，以得到训练数据集。本发明专利技术通过采用不同的编解码技术，并基于将纯净语音通过不同信道进行传输，以使对训练数据集进行了数据扩增，有效的提高了跨信道声纹识别的准确率。

Amplification method, system, mobile terminal and storage medium of training data for voiceprint recognition

全部详细技术资料下载

【技术实现步骤摘要】
声纹识别训练数据扩增方法、系统、移动终端及存储介质
本专利技术声纹识别
，尤其涉及一种声纹识别训练数据扩增方法、系统、移动终端及存储介质。
技术介绍
每个人的声音都蕴涵着特有的生物特征，声纹识别是指利用说话人的声音来识别说话人的一种技术手段。声纹识别同指纹识别等技术一样具有高度的安全可靠性，可以应用在所有需要做身份识别的场合。如在刑侦、银行、证券、保险等金融领域。与传统的身份识别技术相比，声纹识别的优势在于，声纹提取过程简单，成本低，且具有唯一性，不易伪造和假冒。现有声纹识别方案是提前采集至少一个用户的纯净语音数据，并对纯净语音数据进行特征值提取，将提取到的特征值输入声纹模型得到N维声纹向量。后面在做确认或者识别的时候，先获取任意一个用户的语音数据，然后对语音数据提取特征值，将特征值输入声纹模型，得到N维声纹向量，再与声纹库里原有的声纹向量做相似度匹配，每匹配一个用户会得到一个分值，分值最高并且大于阈值的声纹为待测语音所对应的用户。但现有技术中均是采用纯净语音的方式进行声纹识别模型的训练，由于声纹识别过程中待识...

【技术保护点】
1.一种声纹识别训练数据扩增方法，其特征在于，所述方法包括：/n获取纯净原始语音，并对所述纯净原始语音进行加噪处理，得到至少一个加噪语音；/n将所述纯净原始语音与所述加噪语音进行混合，以得到混合语音，并采用至少两种编码方式对所述混合语音进行编码，得到编码数据；/n将所述编码数据通过至少两个信道进行传输，以得到语音传输数据，并对所述语音传输数据进行解码，以得到语音解码数据；/n将所述混合语音与所述语音解码数据进行匹配，并根据匹配结果将所述混合语音中的语音信息与所述语音解码数据中解码信息对应进行存储，以得到训练数据集。/n

【技术特征摘要】
1.一种声纹识别训练数据扩增方法，其特征在于，所述方法包括：
获取纯净原始语音，并对所述纯净原始语音进行加噪处理，得到至少一个加噪语音；
将所述纯净原始语音与所述加噪语音进行混合，以得到混合语音，并采用至少两种编码方式对所述混合语音进行编码，得到编码数据；
将所述编码数据通过至少两个信道进行传输，以得到语音传输数据，并对所述语音传输数据进行解码，以得到语音解码数据；
将所述混合语音与所述语音解码数据进行匹配，并根据匹配结果将所述混合语音中的语音信息与所述语音解码数据中解码信息对应进行存储，以得到训练数据集。

2.如权利要求1所述的声纹识别训练数据扩增方法，其特征在于，所述对所述纯净原始语音进行加噪处理的步骤包括：
采用mfcc方法在所述纯净原始语音中分别对应增加语音回响、语音噪声、背景音乐声和背景说话人声，以对应得到加回响语音、加噪声语音、加背景音乐语音和加背景说话人声语音。

3.如权利要求1所述的声纹识别训练数据扩增方法，其特征在于，所述采用至少两种编码方式对所述混合语音进行编码的步骤包括：
对所述混合语音中的语音数据采用汉明码、Golay码、CRC码、Viterbi码、Turbo码、Polar码或LDPC码中的至少两种编码方式进行编码，以得到所述编码数据。

4.如权利要求1所述的声纹识别训练数据扩增方法，其特征在于，所述将所述编码数据通过至少两个信道进行传输的步骤包括：
将所述编码数据中的编码信息采用3G信道、4G信道、5G信道或电话信道中的至少两种信道进行传输，以得到语音传输数据。

5.如权利要求1所述的声纹识别训练数据扩增方法，其特征在于，所述将所述混合语音与所述语音解码数据进行匹配，并根据匹配结果将所述混合语音中的语音信息与所述语音解码数据中解码信息对应进行存储的步骤包括：
根据所述混合语音的编码结果，对所述混合语音中的语音信息进行编码标识；
根据所述语音传输数据的解码结果对所述语音解码数据中的解码信息进行解码标识；
将所述编...

【专利技术属性】
技术研发人员：张广学，肖龙源，蔡振华，李稀敏，刘晓葳，
申请(专利权)人：厦门快商通科技股份有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人