语音识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:22566703 阅读:35 留言:0更新日期:2019-11-16 12:44
本申请公开了一种语音识别方法、装置、存储介质及电子设备,所述方法包括:获取训练样本,所述训练样本包括真人发音样本和非真人发音样本,提取所述训练样本中的特征信息,将所述训练样本以及特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数,根据所述优化参数生成活体检测模型,当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果,并根据所述预测结果确定是否对所述测试语音进行声纹识别。本申请实施例通过利用标记好的真人发音样本和非真人发音样本进行模型训练,并根据当前模型得到的优化参数再融入到声纹识别系统中进行声纹识别,能够准确识别出真人发音,提升设备的安全性。

Speech recognition method, device, storage medium and electronic equipment

The application discloses a speech recognition method, device, storage medium and electronic device, the method includes: obtaining training samples, the training samples include real voice samples and non real voice samples, extracting feature information in the training samples, inputting the training samples and feature information as training data into the reference model for training, so as to obtain training After the optimization parameters of the reference model, the living detection model is generated according to the optimization parameters. When the test voice is received, the living detection model is used to carry out the living detection of the test voice to generate the prediction results, and determine whether to carry out the voiceprint recognition for the test voice according to the prediction results. The embodiment of the application can accurately recognize the real voice and improve the safety of the equipment by using the marked real voice samples and non real voice samples for model training, and then integrating the optimized parameters obtained according to the current model into the voiceprint recognition system for voiceprint recognition.

【技术实现步骤摘要】
语音识别方法、装置、存储介质及电子设备
本申请涉及移动通信
,尤其涉及移动设备
,具体涉及一种语音识别方法、装置、存储介质及电子设备。
技术介绍
随着电子技术的发展以及智能电子设备的普及,信息安全问题尤为突出。在对智能手机等电子设备进行唤醒或者解锁等用户身份认证时,电子设备通常提供声纹识别算法,但是声纹识别在录音重放以及语音合成攻破的安全保护存在一定的问题。
技术实现思路
本申请实施例提供一种语音识别方法、装置、存储介质及电子设备,能够识别真人发音,防止他人利用录音或者人声合成进行安全攻破,提升安全性。本申请实施例提供一种语音识别方法,应用于电子设备中,所述方法包括:获取训练样本,所述训练样本包括真人发音样本和非真人发音样本;提取所述训练样本中的特征信息;将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数;根据所述优化参数生成活体检测模型;当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果;根据所述预测结果确定是否对所述测试语音进行声纹识别。本申请实施例还提供一种语音识别装置,所述装置包括:获取模块,用于获取训练样本,所述训练样本包括真人发音样本和非真人发音样本;提取模块,用于提取所述训练样本中的特征信息;训练模块,用于将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数;生成模块,用于根据所述优化参数生成活体检测模型;检测模块,用于当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果;识别模块,用于根据所述预测结果确定是否对所述测试语音进行声纹识别。本申请实施例还提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如上所述的语音识别方法。本申请实施例还提供一种电子设备,包括存储器和处理器,其特征在于,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如上所述的语音识别方法。本申请实施例通过获取训练样本,所述训练样本包括真人发音样本和非真人发音样本,提取所述训练样本中的特征信息,将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数,根据所述优化参数生成活体检测模型,当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果,并根据所述预测结果确定是否对所述测试语音进行声纹识别。本申请实施例通过利用标记好的真人发音样本和非真人发音样本进行模型训练,并根据当前模型得到的优化参数再融入到声纹识别系统中进行声纹识别,能够准确识别出真人发音,以防止他人利用录音或者人声合成进行安全攻破,提升设备的安全性。附图说明下面结合附图,通过对本申请的具体实施方式详细描述,将使本申请的技术方案及其它有益效果显而易见。图1为本申请实施例提供的一种语音识别装置的系统示意图。图2为本申请实施例提供的一种语音识别装置的应用场景示意图。图3为本申请实施例提供的一种语音识别方法的流程示意图。图4为本申请实施例提供的一种语音识别方法的另一流程示意图。图5为本申请实施例提供的一种语音识别装置的结构示意图。图6为本申请实施例提供的一种语音识别装置的另一结构示意图。图7为本申请实施例提供的一种电子设备的结构示意图。图8为本申请实施例提供的一种电子设备的另一结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅用于解释本申请,而非对本申请的限定。另外,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请中的术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。在现有技术中,在对智能手机等电子设备进行唤醒或者解锁等用户身份认证时,电子设备通常提供声纹识别算法,但是声纹识别在录音重放以及语音合成攻破的安全保护存在一定的问题。其中,所述电子设备可以是智能手机、平板电脑、台式电脑、笔记本电脑、或者掌上电脑等设备。请参阅图1,图1为本申请实施例提供的一种语音识别装置的系统示意图。该语音识别装置主要用于:预先获取训练样本,并提取训练样本中的特征信息,将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数,根据所述优化参数生成活体检测模型,当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果,并根据所述预测结果确定是否对所述测试语音进行声纹识别能够准确识别出真人发音,以防止他人利用录音或者人声合成进行安全攻破,提升设备的安全性。具体的,请参阅图2,图2为本申请实施例提供的一种语音识别装置的应用场景示意图。比如,语音识别装置在接收到用户输入的测试语音时,将测试语音的特征信息输入到活体检测模型中进行活体检测,以生成预测结果,若所述预测结果为真人发音,则对所述测试语音进行声纹识别以实现用户的身份认证,当身份认证通过时,对电子设备进行解锁,如图2中的状态B所示,当身份认证未通过时,提示认证失败并维持锁定状态。若所述预测结果为非真人发音,则禁止对所述测试语音进行身份认证,并可以发出语音提示或文本提示“非真人发音,禁止认证”,如图2中的状态C所示。本申请实施例提供的一种语音识别方法的执行主体,可以为本申请实施例提供的一种语音识别装置,或者集成了所述语音识别装置的电子设备(譬如掌上电脑、平板电脑、智能手机等),所述语音识别装置可以采用硬件或者软件的方式实现。请参阅图3至图4,图3至图4均为本申请实施例提供的一种语音识别方法的流程示意图。所述方法应用于电子设备中,所述方法包括:步骤101,获取训练样本,所述训练样本包括真人发音样本和非真人发音样本。在一些实施例中,如图4所示,步骤101可以通过步骤1011以及步骤1012来实现,具体为:步骤1011,采本文档来自技高网...

【技术保护点】
1.一种语音识别方法,应用于电子设备中,其特征在于,所述方法包括:/n获取训练样本,所述训练样本包括真人发音样本和非真人发音样本;/n提取所述训练样本中的特征信息;/n将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数;/n根据所述优化参数生成活体检测模型;/n当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果;/n根据所述预测结果确定是否对所述测试语音进行声纹识别。/n

【技术特征摘要】
1.一种语音识别方法,应用于电子设备中,其特征在于,所述方法包括:
获取训练样本,所述训练样本包括真人发音样本和非真人发音样本;
提取所述训练样本中的特征信息;
将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数;
根据所述优化参数生成活体检测模型;
当接收到测试语音时,通过所述活体检测模型对所述测试语音进行活体检测,以生成预测结果;
根据所述预测结果确定是否对所述测试语音进行声纹识别。


2.如权利要求1所述的语音识别方法,其特征在于,所述根据所述预测结果确定是否对所述测试语音进行声纹识别,包括:
若所述预测结果为真人发音,则确定对所述测试语音进行声纹识别以实现用户的身份认证;或者
若所述预测结果为非真人发音,则确定不对所述测试语音进行声纹识别。


3.如权利要求1所述的语音识别方法,其特征在于,所述获取训练样本,包括:
采集真人发音,并标记为所述真人发音样本;
采集非真人发音,并标记为所述非真人发音样本,其中所述非真人发音样本包括真人录音子样本与合成人声录音子样本。


4.如权利要求3所述的语音识别方法,其特征在于,所述采集非真人发音,并标记为所述非真人发音样本,包括:
对所述真人发音样本进行录音采集,并标记为所述非真人发音样本中的真人录音子样本;
对合成人声发音进行录音采集,并标记为所述非真人发音样本中的合成人声录音子样本。


5.如权利要求4所述的语音识别方法,其特征在于,所述提取所述训练样本中的特征信息,包括:
分别提取所述真人发音样本、所述真人录音子样本与所述合成人声录音子样本对应的声谱图;
所述将所述训练样本以及所述特征信息作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数,包括:
将所述真人发音样本、所述真人录音子样本与所述合成人声录音子样本分别对应的声谱图作为训练数据输入参考模型中进行训练,以得到训练后的所述参考模型的优化参数。


6.如权利要求5所述的语音识别方法,其特征在于,所述得到训练后的所述参考模型的优化参数,包括:
获取所述真人发音样本与所述真人录音子样本之间的差异特征值,以得到第一优化参数,以及获取所述真人发音样本与所述合成人声录音子样本之间的差异特征值,以得到第二优化参数;
所述根据所述优化参数生成活体检测模型,包括:根据所述第一优化参数与所述第二优化参数生成活体检测模型。


7.一种语音识别装置,其特征在于,所述装置包括:

【专利技术属性】
技术研发人员:陈岩刘耀勇
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利