语音交互方法、电子设备和存储介质技术

技术编号:33291205 阅读:22 留言:0更新日期:2022-05-01 00:10
本发明专利技术公开神经网络预测模型训练方法、语音交互方法、电子设备和存储介质,其中,一种神经网络预测模型训练方法和语音交互方法,包括:对至少一个非活体音频数据和至少一个真人音频数据进行特征提取,得到对应的特征提取结果,其中,所述至少一个非活体音频数据和所述至少一个真人音频数据分类标注后组成训练集;将所述特征提取结果送入神经网络进行训练,得到对活体和非活体两种维度的预测能力。通过在常规的语音唤醒检测引擎之后设置一个活体音频检测引擎,从而可以实现增强预测速度,减少占用资源,极大的降低设备误唤醒。极大的降低设备误唤醒。极大的降低设备误唤醒。

【技术实现步骤摘要】
语音交互方法、电子设备和存储介质


[0001]本专利技术属于语音数据处理
,尤其涉及神经网络预测模型训练方法、语音交互方法、电子设备和存储介质。

技术介绍

[0002]相关技术中,通过声纹识别技术,判断唤醒词语音是否是设备注册人的唤醒指令,降低他人触发的唤醒事件。使用者首先进行唤醒词声纹注册:进入声纹注册流程,多次说出每一个开启的唤醒词,算法提取声纹特征,完成注册流程;系统开启唤醒功能,唤醒算法实时监听声音是否含有唤醒词;当唤醒算法检测到唤醒词,将唤醒词音频提取出来,送入声纹校验算法提取声纹特征,和注册音频声纹模板对比,给出声纹算法的判断结果:是否是注册人本人的声音。若是注册人本人的声音,唤醒模块对外抛出此时已经触发语音唤醒事件,若非注册人的声纹,则唤醒模块不对外抛出此次检测到的唤醒音频事件。缺陷是需要主动注册声纹才可以使能唤醒词声纹校验功能,用户学习成本上升,使用流程繁琐;每一个唤醒词指令都需要单独注册一次声纹,使用流程繁琐;仅主注册过声纹的用户可以使用,非声纹注册用户无法使用该语音唤醒装置;声纹鲁棒性差,且人的声纹会因为身体因素发生变本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种神经网络预测模型训练方法,包括:对至少一个非活体音频数据和至少一个真人音频数据进行特征提取,得到对应的特征提取结果,其中,所述至少一个非活体音频数据和所述至少一个真人音频数据分类标注后组成训练集;将所述特征提取结果送入神经网络进行训练,得到对活体和非活体两种维度的预测能力。2.根据权利要求1所述的方法,其中,所述非活体音频数据包括与所述真人音频数据对应的电子设备转录音频数据。3.一种语音交互方法,包括:对包含唤醒词的第一音频进行特征提取,得到第一特征提取结果;将所述第一特征提取结果送入预设神经网络预测模型进行预测,其中,所述预设神经网络预测模型为根据权利要求1

2所述的训练方法训练后的能够预测所述特征提取结果对应的第一音频是否是活体音频的模型;若预测所述第一音频是活体音频,唤醒设备并对所述音频进行响应;若预测所述第一音频不是活体音频,不对所述设备进行唤醒。4.根据权利要求3所述的方法,还包括:在语音交互过程中,使用所述预设神经网络预测模型对采集的第二音频对应的第二特征提取结果进行预测;若所述第二特征提取结果中同时包含活体音频和非活体音频,基于所述预设神经网络预测模型的预测结果剔除所述第二音频中的非活体音频得到第三音频,对所述第三音频进行响应;若所述第二特征提取结果中仅包含活体音频,对所述第二音频进行响应;若所述第二特征提取结果中仅包含非活体音频,不对所述第二音频进行响应。5.根据权利要求3所述的方法,其...

【专利技术属性】
技术研发人员:顾向涛
申请(专利权)人:思必驰科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1