多通道音频中语音相关通道的缩放回避的方法和系统技术方案

技术编号：11795643 阅读：98 留言：0更新日期：2015-07-30 00:15

本发明专利技术涉及多通道音频中语音相关通道的缩放回避的方法和系统。一种用于对具有语音通道和至少一个非语音通道的多通道音频信号进行滤波以改善由该信号确定的语音的可辨识度的方法和系统。在典型实施例中，该方法包括步骤：确定指示由该语音通道确定的语音相关内容与由该非语音通道确定的语音相关内容之间的相似程度的至少一个衰减控制值，以及响应于该至少一个衰减控制值对该非语音通道进行衰减。典型地，该衰减步骤包括响应于该至少一个衰减控制值对该非语音通道的原始衰减控制信号，例如回避增益控制信号，进行缩放。一些实施例是通用或专用处理器，用软件或固件编程和/或以其他方式配置为执行根据本发明专利技术的滤波。

全部详细技术资料下载

【技术实现步骤摘要】
多通道音频中语音相关通道的缩放回避的方法和系统本申请是申请日为2011年2月28日、申请号为201180012782.5专利技术名称为“多通道音频中语音相关通道的缩放回避的方法和系统”的专利技术专利申请的分案申请。相关申请的交叉引用本申请要求2010年3月8日提交的美国专利临时申请No.61/311,437的优先权，其整体通过引用合并于此。
本专利技术涉及用于改善由多通道音频信号确定的人类语音(例如对话)的可辨识度的系统和方法。在一些实施例中，本专利技术是一种方法和系统，其通过确定指示由语音通道确定的语音相关内容与由非语音通道确定的语音相关内容之间的相似程度的至少一个衰减控制值，并响应于该衰减控制值对该非语音通道进行衰减，来对具有语音通道和非语音通道的音频信号进行滤波以改善由信号确定的语音可辨识度。
技术介绍
贯穿本公开，包括在权利要求书中，术语“语音”用于广义上指示人类语音。因此，由音频信号确定的“语音”是指信号中在由扬声器(或其他发声换能器)再现信号时感知为人类语音(例如对话、独白、歌声或其他人类语音)的音频内容。根据本专利技术的典型实施例，由音频信号确定的语音的可听度相对于由信号确定的其他音频内容(例如乐器音乐或非语音声音效果)得到改善，由此改善语音的可辨识度(例如，清楚性或理解容易度)。贯穿本公开，包括在权利要求书中，多通道音频信号中的一通道的“语音增强内容”这一表述是指增强由信号的另一通道(例如语音通道)确定的语音内容的可辨识度或其他感知品质的内容(由该通道确定)。本专利技术的典型实施例假定多通道输入音频信号确定的语音的大部分由信号的中央通道确定...
多通道音频中语音相关通道的缩放回避的方法和系统

【技术保护点】
一种对具有语音通道和至少一个非语音通道的多通道音频信号进行滤波以改善由该信号确定的语音的可辨识度的方法，所述方法包括如下步骤：(a)比较该语音通道的特性和该非语音通道的特性以产生用于控制该非语音通道相对于该语音通道的衰减的至少一个衰减值；以及(b)响应于至少一个语音增强可能性值调节该至少一个衰减值以产生用于控制该非语音通道相对于该语音通道的衰减的至少一个调节了的衰减值。

【技术特征摘要】
2010.03.08 US 61/311,4371.一种对具有语音通道和至少一个非语音通道的多通道音频信号进行滤波以改善由该信号确定的语音的可辨识度的方法，所述方法包括如下步骤：(a)比较该语音通道的特性和该非语音通道的对应的特性以产生用于控制该非语音通道的衰减的至少一个衰减值；(b)比较指示由该语音通道确定的语音相关内容的第一语音相关特征序列和指示由该非语音通道确定的语音相关内容的第二语音相关特征序列来确定比较值的序列作为该非语音通道的语音增强可能性值，其中每个该比较值是该第一语音相关特征序列和该第二语音相关特征序列之间在不同时间的相似程度；以及(c)响应于所述语音增强可能性值调节该至少一个衰减值以产生用于控制该非语音通道相对于该语音通道的衰减的至少一个调节了的衰减值。2.如权利要求1所述的方法，其中，步骤(c)包括响应于一个所述语音增强可能性值缩放每个所述衰减值以产生一个所述调节了的衰减值。3.如权利要求1所述的方法，其中，每个所述语音增强可能性值与该非语音通道指示增强由该语音通道确定的语音内容的感知品质的语音增强内容的可能性单调相关。4.如权利要求1所述的方法，还包括如下步骤：响应于该至少一个调节了的衰减值，对该非语音通道进行衰减。5.如权利要求1所述的方法，其中，在步骤(a)中产生的每个所述衰减值是：指示将该非语音通道中的信号功率对该语音通道中的信号功率的比值限制为不超过预定阈值所需的该非语音通道的衰减量的第一因子，其被与该语音通道指示语音的可能性单调相关的第二因子缩放。6.如权利要求1所述的方法，其中，在步骤(a)中产生的每个所述衰减值是指示足以使在存在由该非语音通道确定的内容时由该语音通道确定的语音的预测可辨识度超过预定阈值的该非语音通道的衰减量的第一因子，其被与该语音通道指示语音的可能性单调相关的第二因子缩放。7.如权利要求1所述的方法，其中，在步骤(a)中每个所述衰减值的产生包括如下步骤：确定该语音通道的指示作为频率函数的...

【专利技术属性】
技术研发人员：H·缪施，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人