The invention discloses a speech recognition method, device, device and computer readable storage medium, including: extracting pre-selected feature vectors of real speech in a pre-established corpus; synthesizing forged speech according to the pre-established speech synthesis algorithm and the text information corresponding to the real speech in the corpus, and extracting the pre-selected feature vectors of the forged speech; and utilizing the pre-selected feature vectors of the forged speech; The pre-selected feature vectors of the real speech and the pre-selected feature vectors of the forged speech are described to train the true and false speech classifier, and the collected speech is recognized by the completed training authentic and false speech splitter in order to judge whether the detected speech is forged or not. The method, device, device and computer readable storage medium provided by the invention can accurately and efficiently identify forged voice in actual scene and effectively prevent pseudo-voice attack.
【技术实现步骤摘要】
一种语音识别的方法、装置、设备及计算机存储介质
本专利技术涉及声纹识别
,特别是涉及一种语音识别的方法、装置、设备以及计算机可读存储介质。
技术介绍
近几年声纹识别在各种应用中如声纹支付,声纹锁等对防伪音攻击的需求越来越大。通过对真实语音和伪造语音的声纹特征进行对比识别伪音的要求高,会对同一个元音进行反复比较,因此会花费大量的人力成本。单一的音素检索并不能直接用于声纹鉴定办案审理中,因为对案件的声纹鉴定必须有很专业和确切的比对证据。因此现有技术中,一般通过文本内容和发音规则来识别伪音,从而达到防止录音攻击的目的。而录音的内容与原人声音频内容是相同的,所以不存在能通过对字符串组合或者发音规则就能预预防录音攻击的方法。且通过语音合成方法可以轻松合成一段具有相同字符串组合和发音规则的语音,轻松被语音合成算法破解语音系统。综上所述可以看出,如何高效准确地识别伪造语音是目前有待解决的问题。
技术实现思路
本专利技术的目的是提供一种语音识别的方法、装置、设备以及计算机可读存储介质,已解决现有技术中防伪音攻击的方法不能有效识别伪音的问题。为解决上述技术问题,本专利技术提供一种 ...
【技术保护点】
1.一种语音识别的方法,其特征在于,包括:提取预先建立的语料库中真实语音的预选特征向量;根据预设语音合成算法和所述语料库中所述真实语音对应的文本信息,合成伪造语音,提取所述伪造语音的预选特征向量;利用所述真实语音的预选特征向量和所述伪造语音的预选特征向量对真伪语音分类器进行训练;利用完成训练的真伪语音分器对采集到的待检测的语音进行识别,以便判断所述待检测的语音是否为伪造语音。
【技术特征摘要】
1.一种语音识别的方法,其特征在于,包括:提取预先建立的语料库中真实语音的预选特征向量;根据预设语音合成算法和所述语料库中所述真实语音对应的文本信息,合成伪造语音,提取所述伪造语音的预选特征向量;利用所述真实语音的预选特征向量和所述伪造语音的预选特征向量对真伪语音分类器进行训练;利用完成训练的真伪语音分器对采集到的待检测的语音进行识别,以便判断所述待检测的语音是否为伪造语音。2.如权利要求1所述的方法,其特征在于,所述提取预先建立的语料库中真实语音的预选特征向量包括:利用文本训练深度神经网络模型提取预先建立的语料库中真实语音的Bottleneck特征向量。3.如权利要求2所述的方法,其特征在于,所述根据预设语音合成算法和所述语料库中所述真实语音对应的文本信息,合成伪造语音包括:利用Wavenet模型和所述语料库中所述真实语音对应的文本信息,合成多条伪造语音。4.如权利要求3所述的方法,其特征在于,所述提取所述伪造语音的所述预选特征向量包括:利用感知线性预测算法提取所述多条伪造语音的Bottleneck特征向量。5.如权利要求4所述的方法,其特征在于,所述利用所述真实语音的预选特征向量和所述伪造语音的预选特征向量对真伪语音分类器进行训练包括:利用损失函数、所述真实语音的Bottleneck特征向量和所述伪造语音的Bottleneck特征向量,对所述对真伪语音分类器进行训练;若所述损失函数的输入为所述真实语音的Bottleneck特征向量,则所述损失函数输出1;若所述损失函数的输入为所述伪造语音的Bottleneck特征向量,则所述损失函数输出0。6.如权利要求5所述的方法,其特征在于,所述利用损失函数、...
【专利技术属性】
技术研发人员:高永裕,陈昊亮,
申请(专利权)人:广州势必可赢网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。