The application discloses a speech recognition method, device, storage medium and electronic device, the method includes: obtaining training samples, the training samples include real voice samples and non real voice samples, extracting feature information in the training samples, inputting the training samples and feature information as training data into the reference model for training, so as to obtain training After the optimization parameters of the reference model, the living detection model is generated according to the optimization parameters. When the test voice is received, the living detection model is used to carry out the living detection of the test voice to generate the prediction results, and determine whether to carry out the voiceprint recognition for the test voice according to the prediction results. The embodiment of the application can accurately recognize the real voice and improve the safety of the equipment by using the marked real voice samples and non real voice samples for model training, and then integrating the optimized parameters obtained according to the current model into the voiceprint recognition system for voiceprint recognition.
【技术实现步骤摘要】
语音识别方法、装置、存储介质及电子设备
本申请涉及移动通信
,尤其涉及移动设备
,具体涉及一种语音识别方法、装置、存储介质及电子设备。
技术介绍
随着电子技术的发展以及智能电子设备的普及,信息安全问题尤为突出。在对智能手机等电子设备进行唤醒或者解锁等用户身份认证时,电子设备通常提供声纹识别算法,但是声纹识别在录音重放以及语音合成攻破的安全保护存在一定的问题。
技术实现思路
本申请实施例提供一种语音识别方法、装置、存储介质及电子设备,能够识别真人发音,防止他人利用录音或者人声合成进行安全攻破,提升安全性。本申请实施例提供一种语音识别方法,应用于电子设备中,所述方法包括:获取训练样本,所述训练样本包括真人发音样本和非真人发音样本;提取所述训练样本中的特征信息;将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数;根据所述优化参数生成活体检测模型;当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果;根据所述预测结果确定是否对所述测试语音进行声纹识别。本申请实施例还提供一种语音识别装置,所述装置包括:获取模块,用于获取训练样本,所述训练样本包括真人发音样本和非真人发音样本;提取模块,用于提取所述训练样本中的特征信息;训练模块,用于将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化 ...
【技术保护点】
1.一种语音识别方法,应用于电子设备中,其特征在于,所述方法包括:/n获取训练样本,所述训练样本包括真人发音样本和非真人发音样本;/n提取所述训练样本中的特征信息;/n将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数;/n根据所述优化参数生成活体检测模型;/n当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果;/n根据所述预测结果确定是否对所述测试语音进行声纹识别。/n
【技术特征摘要】 【专利技术属性】
1.一种语音识别方法,应用于电子设备中,其特征在于,所述方法包括:
获取训练样本,所述训练样本包括真人发音样本和非真人发音样本;
提取所述训练样本中的特征信息;
将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数;
根据所述优化参数生成活体检测模型;
当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果;
根据所述预测结果确定是否对所述测试语音进行声纹识别。
2.如权利要求1所述的语音识别方法,其特征在于,所述根据所述预测结果确定是否对所述测试语音进行声纹识别,包括:
若所述预测结果为真人发音,则确定对所述测试语音进行声纹识别以实现用户的身份认证;或者
若所述预测结果为非真人发音,则确定不对所述测试语音进行声纹识别。
3.如权利要求1所述的语音识别方法,其特征在于,所述获取训练样本,包括:
采集真人发音,并标记为所述真人发音样本;
采集非真人发音,并标记为所述非真人发音样本,其中所述非真人发音样本包括真人录音子样本与合成人声录音子样本。
4.如权利要求3所述的语音识别方法,其特征在于,所述采集非真人发音,并标记为所述非真人发音样本,包括:
对所述真人发音样本进行录音采集,并标记为所述非真人发音样本中的真人录音子样本;
对合成人声发音进行录音采集,并标记为所述非真人发音样本中的合成人声录音子样本。
5.如权利要求4所述的语音识别方法,其特征在于,所述提取所述训练样本中的特征信息,包括:
分别提取所述真人发音样本、所述真人录音子样本与所述合成人声录音子样本对应的声谱图;
所述将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数,包括:
将所述真人发音样本、所述真人录音子样本与所述合成人声录音子样本分别对应的声谱图作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数。
6.如权利要求5所述的语音识别方法,其特征在于,所述得到训练后的所述参考模型的优化参数,包括:
获取所述真人发音样本与所述真人录音子样本之间的差异特征值,以得到第一优化参数,以及获取所述真人发音样本与所述合成人声录音子样本之间的差异特征值,以得到第二优化参数;
所述根据所述优化参数生成活体检测模型,包括:根据所述第一优化参数与所述第二优化参数生成活体检测模型。
7.一种语音识别装置,其特征在于,所述装置包括:
技术研发人员:陈岩,刘耀勇,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。