【技术实现步骤摘要】
【国外来华专利技术】背景噪声估计和语音活动检测系统
技术介绍
[0001]语音处理系统被集成到各种电子设备中。例如,许多移动电话设备具有利用自然语言处理系统的虚拟助手,该自然语言处理系统被配置为识别言语并基于识别的言语执行一个或多个操作。自然语言处理是一个计算成本相对较高的过程。因此,与其他设备相比,执行自然语言处理的移动电话设备(或其他设备)可能表现出增加的功耗并因此具有减少的电池寿命。
[0002]为了降低自然语言处理系统中的计算成本,一些系统对接收到的声音信号执行计算成本相对较低的语音活动检测过程,并对检测到语音活动(如果有的话)的声音信号的选定部分执行自然语言处理而不是整个声音信号。一些这样的语音活动检测过程将声音信号的样本与背景噪声的估计进行比较以确定样本中是否存在语音活动。背景噪声的估计可以基于与声音信号相关联的历史值。然而,这样的系统可能无法检测在声音信号中表示的突然响亮的噪声之后发生的语音活动。
技术实现思路
[0003]描述了用于使用非线性更新的背景噪声估计来检测语音活动的系统和方法。
[0004]一种方法包括选择音频信 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:选择音频信号的帧;确定所述帧的第一功率谱密度分布即第一PSD分布;基于非线性权重、所述音频信号的前一帧的第二参考PSD分布和所述前一帧的第二PSD分布生成指示所述帧中的背景噪声的估计的第一参考PSD分布;以及基于所述帧的所述第一PSD分布和所述第一参考PSD分布确定是否在所述帧中检测到语音活动。2.根据权利要求1所述的方法,还包括基于所述第二PSD分布和所述第二参考PSD分布之间的散度来生成所述非线性权重。3.根据权利要求2所述的方法,其中所述散度对应于Kullback
‑
Leibler散度。4.根据权利要求1所述的方法,还包括:生成所述第一PSD分布的第一熵;生成所述第一参考PSD分布的第二熵;生成所述第一参考PSD分布的第一能量;以及生成所述第一参考PSD分布的第二能量,其中基于所述帧的所述第一PSD分布和所述第一参考PSD分布确定是否在所述帧中检测到语音活动包括基于所述第一熵、所述第二熵、所述第一能量和所述第二能量确定是否在所述帧中检测到语音活动。5.根据权利要求4所述的方法,还包括:确定所述第一能量和所述第二能量之间的能量差(ΔE);确定所述第一熵和所述第二熵之间的熵差(ΔH);以及基于所述能量差和所述熵差确定能量熵特征,其中基于所述第一熵、所述第二熵、所述第一能量和所述第二能量确定是否在所述帧中检测到语音活动包括确定所述熵特征是否满足阈值。6.根据权利要求5所述的方法,其中所述能量熵特征等于7.根据权利要求1所述的方法,其中所述帧是根据汉明窗算法生成的。8.一种设备,包括:处理器;以及存储指令的存储器,所述指令可由所述处理器执行以:选择音频信号的帧;确定所述帧的第一功率谱密度分布即第一PSD分布;基于非线性权重、所述音频信号的前一帧的第二参考PSD分布和所述前一帧的第二PSD分布来生成指示所述帧中的背景噪声的估计的第一参考PSD分布;以及基于所述帧的所述第一PSD分布和所述第一参考PSD分布确定是否在所述帧中检测到语音活动。9.根据权利要求8所述的设备,其中所述指令进一步可由所述处理器执行以基于所述第二PSD分布和所述第二参考PSD分布之间的散度来生成所述非线性权重。10.根据权利要求9所述的设备,其中所述散度对应于Kullback
‑
Leibler散度。11.根据权利要求8所述的设备,其中所述指令进一步可由所述处理器执行以:
生成所述第一PSD分布的第一熵;生成所述第一参考PSD分布的第二熵;生成所述第一参考PSD分布的第一能量;以及生成所述第一参考PSD分...
【专利技术属性】
技术研发人员:A,
申请(专利权)人:德克萨斯仪器股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。