用于频谱对比加强的系统、方法、设备及计算机程序产品技术方案

技术编号:4968685 阅读:198 留言:0更新日期:2012-04-11 18:40
本发明专利技术揭示用于基于来自由空间选择性处理滤波器从多通道所感测音频信号导出的噪声参考的信息对语音信号进行的频谱对比加强的系统、方法及设备。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音处理。
技术介绍
以前在安静的办公室或家庭环境中进行的许多活动现今在像汽车、街道或咖啡馆 的声音可变情景中进行。举例来说,一人可能希望使用话音通信信道来与另一人进行通信。 所述信道可(例如)由移动无线手持机或头戴式耳机、对讲机、双向无线电、车载设备或另 一通信装置提供。因此,在用户由其它人包围的环境中,在具有人们倾向于聚集之处通常碰 到的种类的噪声内容的情况下,相当大数量的话音通信是使用移动装置(例如,手持机及/ 或头戴式耳机)来进行的。此噪声倾向于使电话会话的远端处的用户分心或感到恼火。此 外,许多标准自动化商业交易(例如,账户余额或股票报价检查)使用基于话音辨识的数据 查询,且这些系统的准确性可能会受到干扰噪声的显著妨碍。对于通信发生于有噪声环境中的应用来说,可能希望将所要语音信号与背景噪声 分离。可将噪声界定为干扰所要信号或以其它方式使所要信号降级的所有信号的组合。背 景噪声可包括在声环境内产生的众多噪声信号(例如,其它人的背景会话)以及从所述信 号中的每一者产生的反射及回响。除非将所要语音信号与背景噪声分离,否则可能难以可 靠且有效地使用所述语音信号。有噪声声环境还可能倾向于屏蔽或以其它方式使得难以听到所要的再生音频信 号,例如电话会话中的远端信号。声环境可具有与由通信装置正在再生的远端信号竞争的 许多非可控噪声源。此噪声可引起令人不满意的通信体验。除非可将远端信号与背景噪声 区别开,否则可能难以可靠且有效地使用所述远端信号。
技术实现思路
根据通用配置,一种处理语音信号的方法包括使用经配置以处理音频信号的装置 来对多通道感测音频信号执行空间选择性处理操作以产生源信号及噪声参考,且对所述语 音信号执行频谱对比加强操作以产生经处理语音信号。在此种方法中,执行频谱对比加强 操作包括基于来自噪声参考的信息来计算多个噪声子带功率估计;基于来自所述语音信 号的信息来产生加强向量;及基于所述多个噪声子带功率估计、来自所述语音信号的信息 及来自所述加强向量的信息来产生所述经处理语音信号。在此种方法中,所述经处理语音 信号的多个频率子带中的每一者是基于所述语音信号的对应频率子带。根据通用配置,一种用于处理语音信号的设备包括用于对多通道感测音频信号 执行空间选择性处理操作以产生源信号及噪声参考的装置,及用于对所述语音信号执行频 谱对比加强操作以产生经处理语音信号的装置。用于对所述语音信号执行频谱对比加强操 作的所述装置包括用于基于来自噪声参考的信息来计算多个噪声子带功率估计的装置; 用于基于来自所述语音信号的信息来产生加强向量的装置;及用于基于所述多个噪声子带 功率估计、来自所述语音信号的信息及来自所述加强向量的信息来产生所述经处理语音信 号的装置。在此种设备中,所述经处理语音信号的多个频率子带中的每一者是基于所述语 音信号的对应频率子带。根据另一通用配置,一种用于处理语音信号的设备包括空间选择性处理滤波器, 其经配置以对多通道感测音频信号执行空间选择性处理操作以产生源信号及噪声参考;及 频谱对比加强器,其经配置以对所述语音信号执行频谱对比加强操作以产生经处理语音信 号。在此种设备中,所述频谱对比加强器包括功率估计计算器,其经配置以基于来自噪声 参考的信息来计算多个噪声子带功率估计;及加强向量产生器,其经配置以基于来自所述 语音信号的信息来产生加强向量。在此种设备中,所述频谱对比加强器经配置以基于所述 多个噪声子带功率估计、来自所述语音信号的信息及来自所述加强向量的信息来产生所述 经处理语音信号。在此种设备中,所述经处理语音信号的多个频率子带中的每一者是基于 所述语音信号的对应频率子带。根据通用配置,一种计算机可读媒体包括在由至少一个处理器执行时使所述至少 一个处理器执行处理多通道音频信号的方法的指令。这些指令包括在由处理器执行时使 所述处理器对多通道感测音频信号执行空间选择性处理操作以产生源信号及噪声参考的 指令;及在由处理器执行时使所述处理器对所述语音信号执行频谱对比加强操作以产生经 处理语音信号的指令。用以执行频谱对比加强操作的指令包括用以基于来自噪声参考的 信息来计算多个噪声子带功率估计的指令;用以基于来自所述语音信号的信息来产生加强 向量的指令;及用以基于所述多个噪声子带功率估计、来自所述语音信号的信息及来自所 述加强向量的信息来产生所述经处理语音信号的指令。在此种方法中,所述经处理语音信 号的多个频率子带中的每一者是基于所述语音信号的对应频率子带。根据通用配置,一种处理语音信号的方法包括使用经配置以处理音频信号的装 置来使所述语音信号的频谱平滑以获得第一平滑信号;使所述第一平滑信号平滑以获得第 二平滑信号;且产生基于所述第一平滑信号及所述第二平滑信号的比率的对比加强语音信 号。还揭示经配置以执行此方法的设备,以及具有在由至少一个处理器执行时使所述至少 一个处理器执行此方法的指令的计算机可读媒体。附图说明图pattern)O卜实例的波束图(beam双平滑型式及所述平滑频谱与所述双平滑频谱的比率的实例.图角波形的应用, 4勺转移函数的i 角波形的应用,11图27包括指示一组七个巴克标度(Bark scale)子带的边缘的一行点。图28展示子带滤波器阵列SGlO的实施方案SG12的框图。图^A说明通用无限脉冲响应(IIR)滤波器实施方案的转置直接形式II。图^B说明UR滤波器的双二阶实施方案的转置直接形式II结构。图30展示IIR滤波器的双二阶实施方案的一个实例的幅度及相位响应曲线图。图31展示一连串七个双二阶滤波器的幅度及相位响应。图32展示加强器ENlO的实施方案ENllO的框图。图33A展示混合因子计算器FC200的实施方案FC250的框图。图3 展示混合因子计算器FC250的实施方案F(^60的框图。图33C展示增益因子计算器FC300的实施方案FC310的框图。图33D展示增益因子计算器FC300的实施方案FC320的框图。图34A展示伪码列表。图34B展示图34A的伪码列表的修改。图35A及图35B分别展示图34A及图34B的伪码列表的修改。图36A展示增益控制元件CEllO的实施方案CEl 15的框图。图36B展示子带滤波器阵列FA100的包括并联布置的一组带通滤波器的实施方案 FAllO的框图。图37A展示子带滤波器阵列FA100的带通滤波器串联布置的实施方案FA120的框 图。图37B展示IIR滤波器的双二阶实施方案的另一实例。图38展示加强器ENlO的实施方案EN120的框图。图39展示增益控制元件CE120的实施方案CE130的框图。图40A展示设备AlOO的实施方案A160的框图。图40B展示设备A140(及设备A165)的实施方案A165的框图。图41展示图35A的伪码列表的修改。图42展示图35A的伪码列表的另一修改。图43A展示设备AlOO的实施方案A170的框图。图4 展示设备A170的实施方案A180的框图。图44展示加强器ENllO的包括峰值限制器LlO的实施方案EN160的框图。图45A展示描述峰值限制操作的一个实例的伪码列表。图45B展示图45A的伪码列表的另一型式。图46展示设备AlOO的包括分离评估器EVlO的实施方案A200的框图。本文档来自技高网...

【技术保护点】
一种处理语音信号的方法,所述方法包含在经配置以处理音频信号的装置内执行以下动作中的每一者:  对多通道所感测音频信号执行空间选择性处理操作以产生源信号及噪声参考;以及  对所述语音信号执行频谱对比加强操作以产生经处理语音信号,  其中所述执行频谱对比加强操作包括:  基于来自所述噪声参考的信息来计算多个噪声子带功率估计;  基于来自所述语音信号的信息来产生加强向量;以及  基于所述多个噪声子带功率估计、来自所述语音信号的信息及来自所述加强向量的信息来产生所述经处理语音信号,且其中所述经处理语音信号的多个频率子带中的每一者是基于所述语音信号的对应频率子带。

【技术特征摘要】
【国外来华专利技术】US 2008-5-29 61/057,187;US 2009-5-28 12/473,4921.一种处理语音信号的方法,所述方法包含在经配置以处理音频信号的装置内执行以 下动作中的每一者对多通道所感测音频信号执行空间选择性处理操作以产生源信号及噪声参考;以及对所述语音信号执行频谱对比加强操作以产生经处理语音信号,其中所述执行频谱对比加强操作包括基于来自所述噪声参考的信息来计算多个噪声子带功率估计;基于来自所述语音信号的信息来产生加强向量;以及基于所述多个噪声子带功率估计、来自所述语音信号的信息及来自所述加强向量的信 息来产生所述经处理语音信号,且其中所述经处理语音信号的多个频率子带中的每一者是基于所述语音信号的对应频 率子带。2.根据权利要求1所述的处理语音信号的方法,其中所述执行空间选择性处理操作包 括将所述多通道所感测音频信号的方向性分量的能量集中到所述源信号中。3.根据权利要求1所述的处理语音信号的方法,其中所述方法包含对所述装置用无线 方式接收到的信号进行解码以获得经解码语音信号,且其中所述语音信号是基于来自所述经解码语音信号的信息。4.根据权利要求1所述的处理语音信号的方法,其中所述语音信号是基于所述多通道 所感测音频信号。5.根据权利要求1所述的处理语音信号的方法,其中所述执行空间选择性处理操作包 括确定在多个不同频率中的每一者下所述多通道所感测音频信号的通道的相位角之间的 关系。6.根据权利要求1所述的处理语音信号的方法,其中所述产生加强向量包含使所述 语音信号的频谱平滑以获得第一平滑信号,且使所述第一平滑信号平滑以获得第二平滑信 号,且其中所述加强向量是基于所述第一平滑信号与第二平滑信号的比率。7.根据权利要求1所述的处理语音信号的方法,其中所述产生加强向量包含减少所 述语音信号的频谱峰值的幅度之间的差异,且其中所述加强向量是基于所述减少的结果。8.根据权利要求1所述的处理语音信号的方法,其中所述产生经处理语音信号包含 计算多个增益因子值,使得所述多个增益因子值中的每一者是基于来自所述加强向量的对应频率子带的信息;将所述多个增益因子值中的第一者应用于所述语音信号的第一频率子带,以获得所述 经处理语音信号的第一子带;以及将所述多个增益因子值中的第二者应用于所述语音信号的第二频率子带,以获得所述 经处理语音信号的第二子带,其中所述多个增益因子值中的所述第一者不同于所述多个增益因子值中的所述第二者ο9.根据权利要求8所述的处理语音信号的方法,其中所述多个增益因子值中的每一者 是基于所述多个噪声子带功率估计中的对应一者。10.根据权利要求8所述的处理语音信号的方法,其中所述产生经处理语音信号包括 使用滤波器级的级联来对所述语音信号进行滤波;且其中所述将所述多个增益因子值中的第一者应用于所述语音信号的第一频率子带包 含将所述增益因子值应用于所述级联的第一滤波器级;且其中所述将所述多个增益因子值中的第二者应用于所述语音信号的第二频率子带包 含将所述增益因子值应用于所述级联的第二滤波器级。11.根据权利要求1所述的处理语音信号的方法,其中所述方法包含 使用回音消除器来从所述多通道所感测音频信号中消除回音;以及 使用所述经处理语音信号来训练所述回音消除器。12.根据权利要求1所述的处理语音信号的方法,其中所述方法包含基于来自所述噪声参考的信息,对所述源信号执行噪声减少操作以获得所述语音信 号;以及基于所述源信号与所述语音信号之间的关系来执行话音活动检测操作, 其中所述产生经处理语音信号是基于所述话音活动检测操作的结果。13.一种用于处理语音信号的设备,所述设备包含用于对多通道所感测音频信号执行空间选择性处理操作以产生源信号及噪声参考的 装置;以及用于对所述语音信号执行频谱对比加强操作以产生经处理语音信号的装置, 其中所述用于执行频谱对比加强操作的装置包括 用于基于来自所述噪声参考的信息来计算多个噪声子带功率估计的装置; 用于基于来自所述语音信号的信息来产生加强向量的装置;以及 用于基于所述多个噪声子带功率估计、来自所述语音信号的信息及来自所述加强向量 的信息来产生所述经处理语音信号的装置,其中所述经处理语音信号的多个频率子带中的每一者是基于所述语音信号的对应频 率子带。14.根据权利要求13所述的用于处理语音信号的设备,其中所述空间选择性处理操作 包括将所述多通道所感测音频信号的方向性分量的能量集中到所述源信号中。15.根据权利要求13所述的用于处理语音信号的设备,其中所述设备包含用于对所述 设备用无线方式接收到的信号进行解码以获得经解码语音信号的装置;且其中所述语音信号是基于来自所述经解码语音信号的信息。16.根据权利要求13所述的用于处理语音信号的设备,其中所述语音信号是基于所述 多通道所感测音频信号。17.根据权利要求13所述的用于处理语音信号的设备,其中所述用于执行空间选择性 处理操作的装置经配置以确定在多个不同频率中的每一者下所述多通道所感测音频信号 的通道的相位角之间的关系。18.根据权利要求13所述的用于处理语音信号的设备,其中所述用于产生加强向量的 装置经配置以使所述语音信号的频谱平滑以获得第一平滑信号,且使所述第一平滑信号 平滑以获得第二平滑信号,且其中所述加强向量是基于所述第一平滑信号与第二平滑信号的比率。19.根据权利要求13所述的用于处理语音信号的设备,其中所述用于产生加强向量的 装置经配置以执行减少所述语音信号的频谱峰值的幅度之间的差异的操作,且其中所述 加强向量是基于所述操作的结果。20.根据权利要求13所述的用于处理语音信号的设备,其中所述用于产生经处理语音 信号的装置包含用于计算多个增益因子值使得所述多个增益因子值中的每一者是基于来自所述加强 向量的对应频率子带的信息的装置;用于将所述多个增益因子值中的第一者应用于所述语音信号的第一频率子带以获得 所述经处理语音信号的第一子带的装置;以及用于将所述多个增益因子值中的第二者应用于所述语音信号的第二频率子带以获得 所述经处理语音信号的第二子带的装置,其中所述多个增益因子值中的所述第一者不同于所述多个增益因子值中的所述第二者ο21.根据权利要求20所述的用于处理语音信号的设备,其中所述多个增益因子值中的 每一者是基于所述多个噪声子带功率估计中的对应一者。22.根据权利要求20所述的用于处理语音信号的设备,其中所述用于产生经处理语音 信号的装置包括经布置以对所述语音信号进行滤波的滤波器级的级联;且其中所述用于将所述多个增益因子值中的第一者应用于所述语音信号的第一频率子 带的装置经配置以将所述增益因子值应用于所述级联的第一滤波器级,且其中所述用于将所述多个增益因子值中的第二者应用于所述语音信号的第二频率子 带的装置经配置以将所述增益因子值应用于所述级联的第二滤波器级。23.根据权利要求13所述的用于处理语音信号的设备,其中所述设备包含用于从所述 多通道所感测音频信号中消除回音的装置;且其中所述用于消除回音的装置经配置及经布置以通过所述经处理语音信号来加以训练。24.根据权利要求13所述的用于处理语音信号的设备,其中所述设备包含 用于基于来自所述噪声参考的信息对所述源信号执行噪声减少操作以获得所述语音信号的装置;以及用于基于所述源信号与所述语音信号之间的关系来执行话音活动检测操作的装置, 其中所述用于产生经处理语音信号的装置经配置以基于所述话音活动检测操作的结 果来产生所述经处理语音信号。25.一种用于处理语音信号的设备,所述设备包含空间选择性处理滤波器,其经配置以对多通道所感测音频信号执行空间选择性处理操 作以产生源信号及噪声参考;以及频谱对比加强器,其经配置以对所述语音信号执行频谱对比加强操作以产生经处理语音信号,其中所述频谱对比加强器包括功率估计计算器,其经配置以基于来自所述噪声参考的信息来计算多个噪声子带功率 估计;以及加强向量产生器,其经配置以基于来自所述语音信号的信息来产生加强向量,且其中所述频谱对比加强器经配置以基于所述多个噪声子带功率估计、来自所述语音信 号的信息及来自所述加强向量的信息来产生所述经处理语音信号,且其中所述经处理语音信号的多个频率子带中的每一者是基于所述语音信号的对应频 率子带。26.根据权利要求25所述的用于处理语音信号的设备,其中所述空间选择性处理操作 包括将所述多通道所感测音频信号的方向性分量的能量集中到所述...

【专利技术属性】
技术研发人员:杰里米托曼林鸿春埃里克维塞
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1