低复杂度子带语音启动检测制造技术

技术编号：43164046 阅读：33 留言：0更新日期：2024-11-01 19:56

公开了用于低功率和低复杂度语音启动检测器(SOD)的技术，该语音启动检测器使用分数频带滤波器结构和频谱减法技术来导出子带能量分布，以在存在噪声的情况下检测语音的启动。SOD通过使用分数带宽滤波器结构对全频带输入音频信号进行滤波和下采样来导出子带能量分布，分数带宽滤波器结构可以是具有截止频率的低通滤波器，截止频率是输入信号的全带宽的分数。SOD灵活地估计帧上的平均噪声能量和每个子带中的当前帧语音能量，以跟踪每个子带的帧上的噪声和语音能量水平，从而确定用于检测活动语音的一个或多个频带阈值。子带能量分布利用噪声与语音之间的任何频率间隔来检测目标信号中的语音启动。

全部详细技术资料下载

【技术实现步骤摘要】

本主题涉及语音控制的人机接口领域。更具体地，但不作为限制，本主题公开了用于在存在噪声的情况下检测开始说出词语(word)或话语(utterance)的技术，作为用于识别在由用户发出的用以控制音频通信设备的语音命令之前的叫醒词或短语的低功率多级解决方案的一部分。

技术介绍

1、诸如智能电话、台式计算机、膝上型计算机、家庭助理设备等之类的消费电子设备是语音控制的数字设备，其可以通过用户向设备发出语音命令来加以控制。例如，用户可以向设备发出语音命令以进行电话呼叫、发送消息、播放媒体内容、获得查询响应、获得新闻、设置提醒等。讲话者发出的语音命令可能受到来自竞争讲话者的语音、噪声或主讲话者自己的中断的干扰。为了使设备调用应用和服务以准确且及时地响应语音命令，设备需要在嘈杂环境中检测和识别语音命令。

2、叫醒词或短语(统称为唤醒词)用于在人机接口中触发语音控制设备。为了促进低功率，设备上的唤醒词检测电路可以采用多级方案。在第一级中，语音启动检测器(speechonset detector，sod)可以检测开始说出词语或话语。唤醒词检测电...

【技术保护点】

1.一种由设备检测语音的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，对所述音频信号进行滤波包括：

3.根据权利要求2所述的方法，其中，对所述全频带音频信号进行迭代滤波以生成所述连续下采样音频信号的层级包括：

4.根据权利要求1所述的方法，其中，估计所述多个子带的噪声能量和去噪能量包括：

5.根据权利要求4所述的方法，其中，估计与所述多个采样率相对应的所述采样音频数据的所述能量水平包括：

6.根据权利要求4所述的方法，其中，确定所述子带的所述子集的所述归一化能量水平之间的差包括：

7.根据权利要求1所述的...

【技术特征摘要】

1.一种由设备检测语音的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，对所述音频信号进行滤波包括：

3.根据权利要求2所述的方法，其中，对所述全频带音频信号进行迭代滤波以生成所述连续下采样音频信号的层级包括：

4.根据权利要求1所述的方法，其中，估计所述多个子带的噪声能量和去噪能量包括：

5.根据权利要求4所述的方法，其中，估计与所述多个采样率相对应的所述采样音频数据的所述能量水平包括：

6.根据权利要求4所述的方法，其中，确定所述子带的所述子集的所述归一化能量水平之间的差包括：

7.根据权利要求1所述的方法，其中，跟踪所述多个帧上的噪声能量水平和语音能量水平包括：

8.根据权利要求7所述的方法，其中，跟踪所估计的噪声能量的均值和所估计的噪声能量的最大值包括：

9.根据权利要求8所述的方法，其中，所述帧窗口包括多个帧，并且其中，所述间隔中的每个间隔包括由所述帧窗口跨过的时间间隔。

10.根据权利要求1所述的方法，其中，基于所述子带中的每个子带的所述一个或多个频带阈值来确定所述帧中的每个帧中存在语音还是噪声包括：

11.一种装置，包括：

12.根据权利要求11所述的装置，其中，为了对所...

【专利技术属性】
技术研发人员：R·措普夫，
申请(专利权)人：赛普拉斯半导体公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人