The invention discloses a method and a device for improving the speech wake-up performance, wherein, a method for improving the speech wake-up performance includes: detecting an input signal in the form of a voice frame, determining a voice frame as a suspected voice frame or a non voice frame; determining an effective voice segment based on a suspected voice frame and a non voice frame, and determining an effective voice segment in an input signal based on a suspected voice frame and a non voice frame The effective speech segment is input into the wake-up model, where the wake-up model is a multi classification model obtained after supervised deep neural network learning based on the positive samples of wake-up words and the negative samples of non wake-up words collected; the output of the adaptive wake-up model is obtained, and the output is weighted based on the weighted calculation The output of determines whether to wake up the device. The scheme provided by the application can effectively suppress the false wake-up rate of noise scene, and further, can pertinently improve the wake-up rate for specific users.
【技术实现步骤摘要】
提升语音唤醒性能的方法和装置
本专利技术属于语音唤醒
,尤其涉及提升语音唤醒性能的方法和装置。
技术介绍
相关技术中,目前市场上还没有即提升唤醒率又降低误唤醒的样例。唤醒和误唤醒是此消彼长的关系,目前市场上都是择其一做优化,保持一方基本不降的基础上,优化另一方。在降低误唤醒方面,比较有代表的是添加二次验证;提升唤醒率方面,主要是降低唤醒门槛。专利技术人在实现本申请的过程中发现,现有技术中主要存在以下方案:1、添加二次验证模块,设置双重门限,唤醒引擎将接收的语音信号进行初步判断,当满足预设条件则开启二次验证,由二次验证的结果确定设备是否执行唤醒操作;2、降低唤醒门槛,最简单快捷的就是降低唤醒阈值,达到容易唤醒的目的。其中,一方面,二次验证会增加设备的功耗,加大延迟,影响用户在实际中的交互体验;另外,在一些运算资源有限的设备上存在崩溃的风险,不能普及到计算能力较弱的设备上,迅速降低误唤醒的同时也伴随着唤醒率的降低。另一方面,降低唤醒门槛可以有效的提升唤醒率,但是同时会带来误唤醒的提升。
技术实现思路
本专利技术实施例提供一种提升语音唤醒性能的方法和装置,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种提升语音唤醒性能的方法,包括:以语音帧的形式对输入信号进行检测,判定所述语音帧为疑似语音帧或非语音帧;基于判定的疑似语音帧和非语音帧确定有效语音段,并基于所述疑似语音帧和所述非语音帧在所述输入信号中的占比确定加权因子;将所述有效语音段输 ...
【技术保护点】
1.一种提升语音唤醒性能的方法,包括:/n以语音帧的形式对输入信号进行检测,判定所述语音帧为疑似语音帧或非语音帧;/n基于判定的疑似语音帧和非语音帧确定有效语音段,并基于所述疑似语音帧和所述非语音帧在所述输入信号中的占比确定加权因子;/n将所述有效语音段输入至唤醒模型中,其中,所述唤醒模型是基于收集的唤醒词正例样本和非唤醒词反例样本进行有监督地深度神经网络学习后获取的一个多分类模型;/n获取所述自适应唤醒模型的输出,使用所述加权因子对所述输出进行加权计算,基于加权计算后的输出确定是否唤醒设备。/n
【技术特征摘要】
1.一种提升语音唤醒性能的方法,包括:
以语音帧的形式对输入信号进行检测,判定所述语音帧为疑似语音帧或非语音帧;
基于判定的疑似语音帧和非语音帧确定有效语音段,并基于所述疑似语音帧和所述非语音帧在所述输入信号中的占比确定加权因子;
将所述有效语音段输入至唤醒模型中,其中,所述唤醒模型是基于收集的唤醒词正例样本和非唤醒词反例样本进行有监督地深度神经网络学习后获取的一个多分类模型;
获取所述自适应唤醒模型的输出,使用所述加权因子对所述输出进行加权计算,基于加权计算后的输出确定是否唤醒设备。
2.根据权利要求1所述的方法,其中,所述获取所述自适应唤醒模型的输出,使用所述加权因子对所述输出进行加权计算,基于加权计算后的输出确定是否唤醒设备包括:
基于唤醒模型计算有效语音段对于预设唤醒词的置信度,使用所述加权因子对所述置信度进行加权计算;
若加权计算后的置信度大于等于第一预设唤醒阈值,则唤醒设备;
若所述加权计算后的置信度小于所述第一预设唤醒阈值且大于等于第二预设唤醒阈值,则进入预唤醒状态;
若所述加权计算后的置信度小于所述第二预设唤醒阈值,则不唤醒所述设备。
3.根据权利要求2所述的方法,其中,在若所述加权计算后的置信度小于第一预设唤醒阈值且大于等于第二预设唤醒阈值,则进入预唤醒状态之后,所述方法还包括:
对于进入预唤醒状态的输入信号,结合当前的声学环境和用户的使用意图,使用动态调节因子对所述输入信号的后续语音信号的加权计算后的置信度进行调节;
若调节后的置信度大于等于第一预设唤醒阈值,则唤醒设备;
若调节后的置信度小于第一预设唤醒阈值,则不唤醒设备。
4.根据权利要求1-3中任一项所述的方法,其中,所述加权因子与所述疑似语音帧在所述输入信号中的占比成正相关。
5.根据权利要求4所述的方法,其中,所述方法还包括:
当所述疑似语音帧在所述输入信号中的占比x大于等于第一预设阈值y1时,定义所述加权因子为m;
当所述疑似语音帧在所述输入信号中的占比x小于等于第二预设阈值y2时,定义所述加权因子为n,...
【专利技术属性】
技术研发人员:焦蓓,周强,徐俊峰,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。