一种关键词的检测方法以及相关装置制造方法及图纸

技术编号:20946066 阅读:24 留言:0更新日期:2019-04-24 03:02
本发明专利技术公开了一种关键词的检测方法,包括:获取待检测语音信号的增强语音信号,其中,所述增强语音信号对应于目标语速;对所述增强语音信号进行变速处理,得到第一变速语音信号,其中,所述第一变速语音信号对应于第一语速;根据所述第一变速语音信号获取第一语音特征信号;通过关键词检测模型获取所述第一语音特征信号所对应的关键词检测结果,其中,所述关键词检测结果用于表示所述待检测语音信号中是否存在目标关键词;若根据关键词检测结果确定存在目标关键词,则执行目标关键词所对应的操作。本发明专利技术还公开了一种关键词检测装置。本发明专利技术可以对增强后的信号再进行变速处理,能够提升对快语速语音或者慢语速语音中关键词的检出率。

A Keyword Detection Method and Related Devices

The invention discloses a keyword detection method, which includes: acquiring the enhanced speech signal of the speech signal to be detected, in which the enhanced speech signal corresponds to the target speech speed; changing the speed of the enhanced speech signal to obtain the first variable-speed speech signal, in which the first variable-speed speech signal corresponds to the first variable-speed speech signal; and according to the first variable-speed speech signal, the first variable-speed speech signal corresponds to the first variable-speed speech The first speech feature signal is acquired; the keyword detection result corresponding to the first speech feature signal is obtained through the keyword detection model, in which the keyword detection result is used to indicate whether there are target keywords in the speech signal to be detected; if the existence of target keywords is determined according to the keyword detection result, the corresponding operation of target keywords is performed. The invention also discloses a keyword detection device. The invention can process the enhanced signal with variable speed, and can improve the detection rate of keywords in fast speech or slow speech.

【技术实现步骤摘要】
一种关键词的检测方法以及相关装置
本专利技术涉及音频处理
,尤其涉及一种关键词的检测方法以及相关装置。
技术介绍
随着智能语音设备开始推广,通过语音命令与智能设备进行人机交互成为重要功能。在语音交互应用中,基于产品功耗、交互体验以及私密性等考虑,用户需要通过语音关键词来唤醒智能设备进而进行下一步人机语音交互。目前,对于智能语音设备而言,需要预先设定至少一个关键词,在用户唤醒该智能语音设备时,应采用正常的语速念出相应的关键词。通常情况下,对于一个四字关键词而言,采用正常语速念出来大致需要用时0.5秒左右。然而,很多情况下,用户难以保证念出来的关键词语速恒定,比如,用户只用了0.2秒的时间就将一个四字关键词念出来,或者,用户用了将近1.5秒的时间将一个四字关键词念出来,这样的情况下,智能语音设备往往难以检测出当前的语音中是否包含关键词,导致关键词的检出率低下。
技术实现思路
本专利技术实施例提供了一种关键词的检测方法以及相关装置,可以对语音信号进行增强从而有效地提升语音识别质量,进而对增强后的信号再进行变速处理,由此提升对快语速语音或者慢语速语音中关键词的检出率。有鉴于此,本专利技术第一方面提供一种关键词的检测方法,包括:获取待检测语音信号的增强语音信号,其中,所述增强语音信号对应于目标语速;对所述增强语音信号进行变速处理,得到第一变速语音信号,其中,所述第一变速语音信号对应于第一语速,所述第一语速与所述目标语速不一致;根据所述第一变速语音信号获取第一语音特征信号;通过关键词检测模型获取所述第一语音特征信号所对应的关键词检测结果,其中,所述关键词检测结果用于表示所述待检测语音信号中是否存在目标关键词;若根据所述关键词检测结果确定存在所述目标关键词,则执行所述目标关键词所对应的操作。本专利技术第二方面提供一种关键词检测装置,包括:获取模块,用于获取待检测语音信号的增强语音信号,其中,所述增强语音信号对应于目标语速;变速模块,用于对所述获取模块获取的所述增强语音信号进行变速处理,得到第一变速语音信号,其中,所述第一变速语音信号对应于第一语速,所述第一语速与所述目标语速不一致;所述获取模块,还用于根据所述变速模块变速后得到的所述第一变速语音信号获取第一语音特征信号;所述获取模块,还用于通过关键词检测模型获取所述第一语音特征信号所对应的关键词检测结果,其中,所述关键词检测结果用于表示所述待检测语音信号中是否存在目标关键词;执行模块,用于若根据所述获取模块获取的所述关键词检测结果确定存在所述目标关键词,则执行所述目标关键词所对应的操作。在一种可能的设计中,在本专利技术实施例的第二方面的第一种实现方式中,所述获取模块,具体用于获取所述待检测语音信号;通过语音增强算法对所述待检测语音信号进行处理,得到所述增强语音信号。在一种可能的设计中,在本专利技术实施例的第二方面的第二种实现方式中,所述获取模块,具体用于通过单个语音输入设备接收所述待检测语音信号;通过回声消除算法、噪声消除算法以及混响消除算法中的至少一种,对所述待检测语音信号进行处理,得到所述增强语音信号,其中,所述所述回声消除算法用于对所述待检测语音信号中的回声信号进行消除处理,所述噪声消除算法用于对所述待检测语音信号中的稳态噪声和/或非稳态噪声进行抑制处理,所述混响消除算法用于对所述待检测语音信号中的混响进行消除处理。在一种可能的设计中,在本专利技术实施例的第二方面的第三种实现方式中,所述获取模块,具体用于通过多个语音输入设备接收所述待检测语音信号;通过回声消除算法和/或混响消除算法,对所述待检测语音信号进行处理,得到第一待处理信号,其中,所述回声消除算法用于对所述待检测语音信号中的回声信号进行消除处理,所述混响消除算法用于对所述待检测语音信号中的混响进行消除处理,其中,所述第一待处理信号包括多路信号;通过波束形成算法对所述第一待处理信号进行空间滤波处理,得到第二待处理信号,其中,所述第二待处理信号包括一路信号;通过噪声消除算法对所述第二待处理信号中的稳态噪声和/或非稳态噪声进行抑制处理,得到所述增强语音信号。在一种可能的设计中,在本专利技术实施例的第二方面的第四种实现方式中,所述变速模块,具体用于将所述增强语音信号写入至第一先进先出FIFO缓存;当达到所述第一FIFO缓存的存储门限时,从所述第一FIFO缓存中读取待处理增强语音信号,其中,所述待处理增强语音信号的时长小于或等于所述增强语音信号的时长;对所述待处理语音信号进行变速处理,得到目标变速语音信号,其中,所述目标变速语音信号的时长小于或等于所述第一变速语音信号的时长;将所述目标变速语音信号写入至第二FIFO缓存;所述获取模块,具体用于从所述第二FIFO缓存中读取所述目标变速语音信号;根据所述目标变速语音信号生成所述第一语音特征信号,其中,所述第一语音特征信号包括梅尔频率倒谱系数MFCC特征信号、滤波器组Fbanks以及线性预测倒谱系数LPCC中的至少一种。在一种可能的设计中,在本专利技术实施例的第二方面的第五种实现方式中,所述变速模块,具体用于根据所述待处理语音信号、第一样本数以及分析帧步长确定第一语音帧;根据所述第一语音帧、所述第一样本数以及合成步长,计算得到自然连续语音帧;根据所述待处理语音信号以及所述分析帧步长确定第二语音帧;根据所述第二语音帧以及所述自然连续语音帧,获取第二样本数;根据所述待处理语音信号、所述第二样本数以及以及分析帧步长,确定待匹配语音帧;根据所述第一语音帧以及所述待匹配语音帧确定所述目标变速语音信号。在一种可能的设计中,在本专利技术实施例的第二方面的第六种实现方式中,所述变速模块,具体用于采用如下方式计算所述第二样本数:其中,所述Δk+1表示所述第二样本数,所述cA(k,Δk+1)表示两个语音帧的最小互平均幅度差分函数系数,所述k表示第k个语音帧,所述Δ表示样本数,所述表示所述自然连续语音,所述Δmax表示可移动的最大样本数,所述xk+1(n+Δk+1)表示待匹配的所述第二语音帧,所述argmin表示所述cA(k,Δk+1)取最小值时的变量值,所述n为大于或等于1,且小于或等于所述N的整数。在一种可能的设计中,在本专利技术实施例的第二方面的第七种实现方式中,所述关键词检测装置还包括确定模块;所述确定模块,用于所述获取模块通过关键词检测模型获取所述第一语音特征信号所对应的关键词检测结果之后,若所述关键词检测结果为第一字符,则根据所述第一字符确定所述待检测语音信号中存在所述目标关键词;所述确定模块,还用于所述获取模块通过关键词检测模型获取所述第一语音特征信号所对应的关键词检测结果之后,若所述关键词检测结果为第二字符,则根据所述第二字符确定所述待检测语音信号中不存在所述目标关键词。在一种可能的设计中,在本专利技术实施例的第二方面的第八种实现方式中,所述关键词检测装置还包括确定模块;所述确定模块,用于所述获取模块通过关键词检测模型获取所述第一语音特征信号所对应的关键词检测结果之后,根据所述关键词检测结果确定目标概率值;所述确定模块,还用于若所述目标概率值大于或等于关键词概率阈值,则确定所述待检测语音信号中存在所述目标关键词;所述确定模块,还用于若所述目标概率值小于所述关键词概率阈值,则确定所述待检测语音信号中不存在所述本文档来自技高网...

【技术保护点】
1.一种关键词的检测方法,其特征在于,包括:获取待检测语音信号的增强语音信号,其中,所述增强语音信号对应于目标语速;对所述增强语音信号进行变速处理,得到第一变速语音信号,其中,所述第一变速语音信号对应于第一语速,所述第一语速与所述目标语速不一致;根据所述第一变速语音信号获取第一语音特征信号;通过关键词检测模型获取所述第一语音特征信号所对应的关键词检测结果,其中,所述关键词检测结果用于表示所述待检测语音信号中是否存在目标关键词;若根据所述关键词检测结果确定存在所述目标关键词,则执行所述目标关键词所对应的操作。

【技术特征摘要】
1.一种关键词的检测方法,其特征在于,包括:获取待检测语音信号的增强语音信号,其中,所述增强语音信号对应于目标语速;对所述增强语音信号进行变速处理,得到第一变速语音信号,其中,所述第一变速语音信号对应于第一语速,所述第一语速与所述目标语速不一致;根据所述第一变速语音信号获取第一语音特征信号;通过关键词检测模型获取所述第一语音特征信号所对应的关键词检测结果,其中,所述关键词检测结果用于表示所述待检测语音信号中是否存在目标关键词;若根据所述关键词检测结果确定存在所述目标关键词,则执行所述目标关键词所对应的操作。2.根据权利要求1所述的检测方法,其特征在于,所述获取待检测语音信号的增强语音信号,包括:获取所述待检测语音信号;通过语音增强算法对所述待检测语音信号进行处理,得到所述增强语音信号。3.根据权利要求2所述的检测方法,其特征在于,所述获取所述待检测语音信号,包括:通过单个语音输入设备接收所述待检测语音信号;所述通过语音增强算法对所述待检测语音信号进行处理,得到所述增强语音信号,包括:通过回声消除算法、噪声消除算法以及混响消除算法中的至少一种,对所述待检测语音信号进行处理,得到所述增强语音信号,其中,所述所述回声消除算法用于对所述待检测语音信号中的回声信号进行消除处理,所述噪声消除算法用于对所述待检测语音信号中的稳态噪声和/或非稳态噪声进行抑制处理,所述混响消除算法用于对所述待检测语音信号中的混响进行消除处理。4.根据权利要求2所述的检测方法,其特征在于,所述获取所述待检测语音信号,包括:通过多个语音输入设备接收所述待检测语音信号;所述通过语音增强算法对所述待检测语音信号进行处理,得到所述增强语音信号,包括:通过回声消除算法和/或混响消除算法,对所述待检测语音信号进行处理,得到第一待处理信号,其中,所述回声消除算法用于对所述待检测语音信号中的回声信号进行消除处理,所述混响消除算法用于对所述待检测语音信号中的混响进行消除处理,其中,所述第一待处理信号包括多路信号;通过波束形成算法对所述第一待处理信号进行空间滤波处理,得到第二待处理信号,其中,所述第二待处理信号包括一路信号;通过噪声消除算法对所述第二待处理信号中的稳态噪声和/或非稳态噪声进行抑制处理,得到所述增强语音信号。5.根据权利要求1所述的检测方法,其特征在于,所述对所述增强语音信号进行变速处理,得到第一变速语音信号,包括:将所述增强语音信号写入至第一先进先出FIFO缓存;当达到所述第一FIFO缓存的存储门限时,从所述第一FIFO缓存中读取待处理增强语音信号,其中,所述待处理增强语音信号的时长小于或等于所述增强语音信号的时长;对所述待处理语音信号进行变速处理,得到目标变速语音信号,其中,所述目标变速语音信号的时长小于或等于所述第一变速语音信号的时长;将所述目标变速语音信号写入至第二FIFO缓存;所述根据所述第一变速语音信号获取第一语音特征信号,包括:从所述第二FIFO缓存中读取所述目标变速语音信号;根据所述目标变速语音信号生成所述第一语音特征信号,其中,所述第一语音特征信号包括梅尔频率倒谱系数MFCC特征信号、滤波器组Fbanks以及线性预测倒谱系数LPCC中的至少一种。6.根据权利要求5所述的检测方法,其特征在于,所述对所述待处理语音信号进行变速处理,得到目标变速语音信号,包括:根据所述待处理语音信号、第一样本数以及分析帧步长确定第一语音帧;根据所述第一语音帧、所述第一样本数以及合成步长,计算得到自然连续语音帧;根据所述待处理语音信号以及所述分析帧步长确定第二语音帧;根据所述第二语音帧以及所述自然连续语音帧,获取第二样本数;根据所述待处理语音信号、所述第二样本数以及以及分析帧步长,确定待匹配语音帧;根据所述第一语音帧以及所述待匹配语音帧确定所述目标变速语音信号。7.根据权利要求6所述的检测方法,其特征在于,所述根据所述第二语音帧以及所述自然连续语音帧,获取第二样本数,包括:采用如下方式计算所述第二样本数:其中,所述Δk+1表示所述第二样本数,所述cA(k,Δk+1)表示两个语音帧的最小互平均幅度差分函数系数,所述k表示第k个语音帧,所述Δ表示样本数,所述表示所述自然连续语音,所述Δmax表示可移动的最大样本数,所述xk+1(n+Δk+1)表示待匹配的所述第二语音帧,所述argmin表示所述cA(k,Δk+1)取最小值时的变量值,所述n为大于或等于1,且小于或等于所述N的整数。8.根据权利要求1所述的检测方法,其特征在于,所述通过关键词检测模型获取所述第一语音特征信号所对应的关键词检测结果之后,所述方法还包括:若所述关键词检测结果为第一字符,则根据所述第一字符确定所...

【专利技术属性】
技术研发人员:高毅刘二男罗敏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1