【技术实现步骤摘要】
本主题涉及语音控制的人机接口领域。更具体地,但不作为限制,本主题公开了用于在存在噪声的情况下检测开始说出词语(word)或话语(utterance)的技术,作为用于识别在由用户发出的用以控制音频通信设备的语音命令之前的叫醒词或短语的低功率多级解决方案的一部分。
技术介绍
1、诸如智能电话、台式计算机、膝上型计算机、家庭助理设备等之类的消费电子设备是语音控制的数字设备,其可以通过用户向设备发出语音命令来加以控制。例如,用户可以向设备发出语音命令以进行电话呼叫、发送消息、播放媒体内容、获得查询响应、获得新闻、设置提醒等。讲话者发出的语音命令可能受到来自竞争讲话者的语音、噪声或主讲话者自己的中断的干扰。为了使设备调用应用和服务以准确且及时地响应语音命令,设备需要在嘈杂环境中检测和识别语音命令。
2、叫醒词或短语(统称为唤醒词)用于在人机接口中触发语音控制设备。为了促进低功率,设备上的唤醒词检测电路可以采用多级方案。在第一级中,语音启动检测器(speechonset detector,sod)可以检测开始说出词语或话语。唤醒词检测电
...【技术保护点】
1.一种由设备检测语音的方法,所述方法包括:
2.根据权利要求1所述的方法,其中,对所述音频信号进行滤波包括:
3.根据权利要求2所述的方法,其中,对所述全频带音频信号进行迭代滤波以生成所述连续下采样音频信号的层级包括:
4.根据权利要求1所述的方法,其中,估计所述多个子带的噪声能量和去噪能量包括:
5.根据权利要求4所述的方法,其中,估计与所述多个采样率相对应的所述采样音频数据的所述能量水平包括:
6.根据权利要求4所述的方法,其中,确定所述子带的所述子集的所述归一化能量水平之间的差包括:
7.
...【技术特征摘要】
1.一种由设备检测语音的方法,所述方法包括:
2.根据权利要求1所述的方法,其中,对所述音频信号进行滤波包括:
3.根据权利要求2所述的方法,其中,对所述全频带音频信号进行迭代滤波以生成所述连续下采样音频信号的层级包括:
4.根据权利要求1所述的方法,其中,估计所述多个子带的噪声能量和去噪能量包括:
5.根据权利要求4所述的方法,其中,估计与所述多个采样率相对应的所述采样音频数据的所述能量水平包括:
6.根据权利要求4所述的方法,其中,确定所述子带的所述子集的所述归一化能量水平之间的差包括:
7.根据权利要求1所述的方法,其中,跟踪所述多个帧上的噪声能量水平和语音能量水平包括:
8.根据权利要求7所述的方法,其中,跟踪所估计的噪声能量的均值和所估计的噪声能量的最大值包括:
9.根据权利要求8所述的方法,其中,所述帧窗口包括多个帧,并且其中,所述间隔中的每个间隔包括由所述帧窗口跨过的时间间隔。
10.根据权利要求1所述的方法,其中,基于所述子带中的每个子带的所述一个或多个频带阈值来确定所述帧中的每个帧中存在语音还是噪声包括:
11.一种装置,包括:
12.根据权利要求11所述的装置,其中,为了对所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。