信号处理方法、设备及存储介质技术

技术编号:21550162 阅读:31 留言:0更新日期:2019-07-06 22:50
本公开实施例提供一种信号处理方法、设备及存储介质。该信号处理方法包括:获取待处理音频信号;通过对待处理音频信号进行时频变换,获取待处理音频信号对应的频域信号,并计算频域信号中多个频点的能量值,之后,获取预设的映射关系,该映射关系包括各频点在不同能量值下的频响,并根据频点的能量值及上述映射关系,获取该频点对应的归一化后的能量值。本公开实施例基于包含有频点和能量值的两个维度的映射关系,确定该频点对应的归一化后的能量值,可提升使用归一化后的能量值进行分布式语音唤醒决策的精度。

Signal Processing Method, Equipment and Storage Media

【技术实现步骤摘要】
信号处理方法、设备及存储介质
本公开涉及信号处理技术,尤其涉及一种信号处理方法、设备及存储介质。
技术介绍
随着物联网的快速发展,智能家居多设备互联。该情况下,分布式语音唤醒决策是响应用户需求的第一步。然而,由于各设备厂商在麦克风选型和拾音声学结构上的设计差异,甚至同一款设备都有多家麦克风供应商,因此麦克风的底噪及灵敏度等参数差异较大。另外,麦克风较难满足频响曲线随能量值线性增加的理论,再加上声学结构上的细微差异,频响曲线与能量值的关系在一定程度上是非线性的,导致使用能量值相关参数进行分布式语音唤醒决策的精度下降。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种信号处理方法、设备及存储介质。所述技术方案如下:根据本公开实施例的第一方面,提供一种信号处理方法。该信号处理方法包括:获取待处理音频信号;通过对所述待处理音频信号进行时频变换,获取所述待处理音频信号对应的频域信号;计算所述频域信号中多个频点的能量值;获取预设的映射关系,所述映射关系包括各频点在不同能量值下的频响;根据所述频点的能量值及所述映射关系,获取所述频点对应的归一化后的能量值。本公开的实施例提供的技术方案可以包括以下有益效果:对获取的待处理音频信号进行时频变换,获取待处理音频信号对应的频域信号,并计算频域信号中多个频点的能量值,之后,获取预设的映射关系,其中映射关系包括各频点在不同能量值下的频响,根据频点的能量值及该映射关系,获取该频点对应的归一化后的能量值。由于麦克风的频响曲线与能量值是非线性的,导致不同麦克风在不同能量值下的频响也有不同,基于此,本实施例在实际应用中基于包含有频点和能量值的两个维度的映射关系确定该频点对应的归一化后的能量值,从而提升使用归一化后的能量值进行分布式语音唤醒决策的精度。可选地,所述时频变换,包括:快速傅里叶变换FFT或小波变换。上述实施例提供的技术方案可以包括以下有益效果:提供两种具体的时频转换实现方式:快速傅里叶变换或小波变换,将时域的待处理音频信号变换为频域信号。可选地,所述计算所述频域信号中多个频点的能量值,包括:计算所述频域信号中前一半频点的能量值。本公开的实施例提供的技术方案可以包括以下有益效果:利用信号在频域上的对称性,仅计算频域信号中前一般频点的能量值,从而可减小计算量,提升效率。可选地,所述计算所述频域信号中多个频点的能量值,包括:计算去除低频频点后的频域信号中各频点的能量值。本公开的实施例提供的技术方案可以包括以下有益效果:计算去除低频频点后的频域信号中各频点的能量值,一方面,可减少计算量;另一方面,可以降低低频的底噪干扰,进一步提升使用归一化后的能量值进行分布式语音唤醒决策的精度。可选地,所述根据所述频点的能量值及所述映射关系,获取所述频点对应的归一化后的能量值,包括:在所述映射关系中,确定所述频点下与所述频点的能量值最接近的第一能量值;确定所述频点在所述第一能量值下的频响;将所述频点的能量值与所述频点在所述第一能量值下的频响相乘,获取所述频点对应的归一化后的能量值。本公开的实施例提供的技术方案可以包括以下有益效果:提供一种具体的获取频点对应的归一化后的能量值的实现方式。可选地,所述映射关系是在消音环境下,根据标准麦克风及拾音设备中的麦克风二者基于测试音频信号的能量值获取的,所述测试音频信号为呈阶梯变化的能量信号。本公开的实施例提供的技术方案可以包括以下有益效果:一方面,利用消音环境降低周围环境造成的干扰;另一方面,考虑到麦克风频响曲线与能量值的非线性,通过将测试音频信号设置为呈阶梯变化的能量信号,来获取频点在不同能量值下对应的频响,为后续实际应用中获取频点对应的归一化后的能量值提供数据支撑。根据本公开实施例的第二方面,提供一种信号处理设备。该信号处理设备包括:第一获取模块,被配置为获取待处理音频信号;变换模块,被配置为通过对所述待处理音频信号进行时频变换,获取所述待处理音频信号对应的频域信号;计算模块,被配置为计算所述频域信号中多个频点的能量值;第二获取模块,被配置为获取预设的映射关系,所述映射关系包括各频点在不同能量值下的频响;处理模块,被配置为根据所述频点的能量值及所述映射关系,获取所述频点对应的归一化后的能量值。本公开的实施例提供的技术方案可以包括以下有益效果:对获取的待处理音频信号进行时频变换,获取待处理音频信号对应的频域信号,并计算频域信号中多个频点的能量值,之后,获取预设的映射关系,该映射关系包括各频点在不同能量值下的频响,并根据频点的能量值及该映射关系,获取该频点对应的归一化后的能量值。由于麦克风的频响曲线与能量值是非线性的,导致不同麦克风在不同能量值下的频响也有不同,基于此,本实施例在实际应用中基于包含有频点和能量值两个维度的映射关系,确定该频点对应的归一化后的能量值,从而提升使用归一化后的能量值进行分布式语音唤醒决策的精度。可选地,所述时频变换,包括:快速傅里叶变换或小波变换。上述实施例提供的技术方案可以包括以下有益效果:提供两种具体的时频转换实现方式:快速傅里叶变换或小波变换,将时域的待处理音频信号变换为频域信号。可选地,所述计算模块被配置为:计算所述频域信号中前一半频点的能量值。本公开的实施例提供的技术方案可以包括以下有益效果:利用信号在频域上的对称性,仅计算频域信号中前一般频点的能量值,从而可减小计算量,提升效率。可选地,所述计算模块被配置为:计算去除低频频点后的频域信号中各频点的能量值。本公开的实施例提供的技术方案可以包括以下有益效果:计算去除低频频点后的频域信号中各频点的能量值,一方面,可减少计算量;另一方面,可以降低低频的底噪干扰,进一步提升使用归一化后的能量值进行分布式语音唤醒决策的精度。可选地,所述处理模块被配置为:在上述映射关系中,确定所述频点下与所述频点的能量值最接近的第一能量值;确定所述频点在所述第一能量值下的频响;将所述频点的能量值与所述频点在所述第一能量值下的频响相乘,获取所述频点对应的归一化后的能量值。本公开的实施例提供的技术方案可以包括以下有益效果:提供一种具体的获取频点对应的归一化后的能量值的实现方式。可选地,所述映射关系是在消音环境下,根据标准麦克风及拾音设备中的麦克风二者基于测试音频信号的能量值获取的,所述测试音频信号为呈阶梯变化的能量信号。本公开的实施例提供的技术方案可以包括以下有益效果:一方面,利用消音环境降低周围环境造成的干扰;另一方面,考虑到麦克风频响曲线与能量值的非线性,通过将测试音频信号设置为呈阶梯变化的能量信号,来获取频点在不同能量值下对应的频响,为后续实际应用中获取频点对应的归一化后的能量值提供数据支撑。根据本公开实施例的第三方面,提供一种信号处理设备。该信号处理设备包括:处理器和用于存储可执行指令的存储器;其中,处理器被配置为执行所述可执行指令,以执行如第一方面任一项所述的方法。根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面任一项所述的方法。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的本文档来自技高网...

【技术保护点】
1.一种信号处理方法,其特征在于,包括:获取待处理音频信号;通过对所述待处理音频信号进行时频变换,获取所述待处理音频信号对应的频域信号;计算所述频域信号中多个频点的能量值;获取预设的映射关系,所述映射关系包括各频点在不同能量值下的频响;根据所述频点的能量值及所述映射关系,获取所述频点对应的归一化后的能量值。

【技术特征摘要】
1.一种信号处理方法,其特征在于,包括:获取待处理音频信号;通过对所述待处理音频信号进行时频变换,获取所述待处理音频信号对应的频域信号;计算所述频域信号中多个频点的能量值;获取预设的映射关系,所述映射关系包括各频点在不同能量值下的频响;根据所述频点的能量值及所述映射关系,获取所述频点对应的归一化后的能量值。2.根据权利要求1所述的方法,其特征在于,所述时频变换包括:快速傅里叶变换FFT或小波变换。3.根据权利要求1所述的方法,其特征在于,所述计算所述频域信号中多个频点的能量值,包括:计算所述频域信号中前一半频点的能量值。4.根据权利要求1所述的方法,其特征在于,所述计算所述频域信号中多个频点的能量值,包括:计算去除低频频点后的频域信号中各频点的能量值。5.根据权利要求1所述的方法,其特征在于,所述根据所述频点的能量值及所述映射关系,获取所述频点对应的归一化后的能量值,包括:在所述映射关系中,确定所述频点下与所述频点的能量值最接近的第一能量值;确定所述频点在所述第一能量值下的频响;将所述频点的能量值与所述频点在所述第一能量值下的频响相乘,获取所述频点对应的归一化后的能量值。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述映射关系是在消音环境下,根据标准麦克风及拾音设备中的麦克风二者基于测试音频信号的能量值获取的,所述测试音频信号为呈阶梯变化的能量信号。7.一种信号处理设备,其特征在于,包括:第一获取模块,被配置为获取待处理音频信号;变换模块,被配置为通过对所述待处理音频信号进行时频变换,获取所述...

【专利技术属性】
技术研发人员:王昭
申请(专利权)人:北京小米智能科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1