声音信号处理方法和装置制造方法及图纸

技术编号:3556423 阅读:218 留言:0更新日期:2012-04-11 18:40
一种声音信号处理方法,其包含:计算多通道输入声音信号中每两个之间的差异以获得多个特征量,每一所述特征量表示所述差异;从包含多通道的多个加权系数的加权系数字典中选择对应于所述输入特征量的加权系数;采用所述选择的加权系数对所述声音信号进行加权;以及对所述加权后的输入声音信号进行相加以生成输出声音信号。

【技术实现步骤摘要】
声音信号处理方法和装置
本专利技术涉及一种用于强调输入声音信号中的目标语音信号并输出经强调后的语音信号的声音信号处理方法及装置。
技术介绍
当语音识别技术被用于实际环境中时,周围的噪音对语音识别率有着很大的影响。存在着多种噪音,例如发动机声音(风噪音)、对向的车辆的声音、经过的车辆的声音、车辆中车辆音频装置的声音。这些噪音被混合在说话者的话音之中并被输入到语音识别系统中,由此导致识别率的大为下降。话筒阵列的采用被认为是解决这样一种噪音问题的方法。话筒阵列使来自多个话筒的输入声音信号受到信号处理以便对目标语音信号进行强调并输出经强调后的语音信号,其中,目标语音信号为说话者的话音。众所周知,适应型话筒阵列通过自动将话筒的接收声音灵敏度较低的死角(null)转向噪音到来的方向来抑制噪音。适应型话筒阵列在这样的条件(约束条件)下设计:目标声音方向的信号通常不被抑制。结果,可以在不抑制来自话筒阵列正面方向的目标语音信号的情况下抑制来自话筒阵列侧面的噪音。然而,存在所谓的残响(reverberation)问题,即在实际环境中,位于话筒阵列正面的说话者的话音被说话者周围的障碍物例如墙壁等反射,且来自各种方向的话音分量进入话筒。在传统的适应型话筒阵列中没有考虑到残响。结果,当适应型话筒阵列在残响情况下应用时,存在具有被称作“目标信号消除”现象的问题,即应当被强调的目标语音信号不正确地被抑制了。-->如果残响的影响已知,即从声音源到话筒的传递函数已知,人们设想出一种可以防止目标信号消除问题的方法。例如,J.L.Flanagan、A.C.Surendran和E.E.Jan在“Spatially Selective Sound Capture for Speechand Audio Processing”(Speech Communication,13,pp207-222,1993)中提出了一种方法,该方法对来自话筒的输入声音信号用匹配的滤波器进行滤波,该滤波器由以脉冲响应形式表达的传递函数提供。A.V.Oppenheim和R.W.Schafer在“Digital Signal Processing”(Prentice Hall,pp.519-524,1975)中提供了一种通过将输入声音信号转换为倒频谱(cepstrum)并对高阶倒频谱进行抑制来减小残响的方法。J.L.Flanagan等人的方法必须预先知道脉冲响应,因此有必要在系统实际被使用的环境中测量脉冲响应。由于存在许多影响车辆中的传递函数的要素,例如乘客和负载、窗户的开与关等,必须预先知道这种脉冲响应的方法是难以实施的。另一方面,A.V.Oppenheim等人利用了残响分量在倒频谱的较高项中易于出现的趋势。但是,由于直接波和残响分量不完全分离,因此,能在多大程度上移除对适应型话筒阵列有害的残响分量取决于系统的情况。车辆的空间非常狭小,小到以至于反射分量在短时间范围内集中。于是,直接声音和反射的声音混合,并极大地改变了频谱。因此,采用倒频谱的方法不能充分分离直接波与残响分量,故而难以防止由于残响影响所引起的目标信号消除。在车辆的狭小空间中,上述现有技术存在不能对导致话筒阵列目标信号消除的残响分量充分进行移除的问题。
技术实现思路
本专利技术的一个实施形态提供了一种声音信号处理方法,其包含:准备加权系数字典,该字典包含与多个特征量联系的多个加权系数,每一特征量表示多通道声音信号之间的差异;计算在多通道输入声音信号中每很少几个之间的输入声音信号差异以获得多个输入特征量,每个输入特征量表-->示输入声音信号差异;从加权系数字典中选择对应于所述输入特征量的多个加权系数;利用所选择的加权系数对输入声音信号进行加权;以及将加权后的输入声音信号相加以生成输出声音信号。附图说明图1为关于第一实施例的声音信号处理装置的框图;图2为示出关于第一实施例的处理过程的流程图;图3阐释了第一实施例中设置加权系数的方法;图4阐释了第一实施例中设置加权系数的方法;图5为关于第二实施例的声音信号处理装置的框图;图6为关于第三实施例的声音信号处理装置的框图;图7为示出关于第三实施例的处理过程的流程图;图8为采用了根据第四实施例的声音信号处理装置的系统的原理性平面图;图9为采用了根据第五实施例的声音信号处理装置的系统的原理性平面图;图10为采用了根据第六实施例的声音信号处理装置的回声消除器的框图。具体实施方式参照附图将介绍本专利技术的实施例。第一实施例如图1所示,根据第一实施例的声音信号处理装置包含:特征量计算器102,其计算来自多个(N个)话筒101-1至101-N的N通道接收声音信号(输入声音信号)的通道间特征量;加权系数字典103,其存储了多个加权系数;选择器104,其基于通道间特征量在加权系数字典103中选择加权系数;多个加权单元105-1至105-N,其用所选择的加权系数对输入声音信号x1至xN进行加权;以及加法器,其对加权单元105-1至105-N-->的经加权后的输出信号进行相加,输出经强调后的输出声音信号。本实施例的处理过程根据图2的流程图进行阐释。来自话筒101-1至101-N的输入声音信号x1至xN被输入到特征量计算器102以计算通道间特征量(步骤S11)。当采用数字信号处理技术时,输入声音信号x1至xN用未示出的AD转换器在时间方向上进行离散化,并采用例如时标t来表示为x1(t)。通道间特征量是表示例如输入声音信号x1至xN的每两个通道之间的差异的量,并在下文具体介绍。如果输入声音信号x1至xN是离散化的,通道间特征量也是离散化的。根据通道间特征量,由选择器104从加权系数字典103中选取与通道间特征量对应的加权系数w1至wN(步骤S12)。预先确定通道间特征量与加权系数w1...wN的关系。最简单的方法是将离散化的通道间特征量与离散化的加权系数w1至wN一一对应地联系在一起的方法。更有效率地将离散化的通道间特征量与离散化的加权系数w1至wN相联系的方法是:如同下面的第三实施例所阐释的那样,采用例如LBG等聚类(clustering)方法对通道间特征量进行分组、并将加权系数w1至wN联系到通道间特征量的组的方法。另外,可考虑采用例如GMM(高斯混合模型)等统计分布来将该分布的权重与加权系数w1至wN联系在一起的方法。可考虑用于将通道间特征量与加权系数相联系的如上所述的多种方法,并在考虑到计算复杂性或存储器数量的情况下确定合适的方法。由选择器104所选择的加权系数w1至wN被设置到加权单元105-1至105-N。输入声音信号x1至xN在由加权单元105-1至105-N根据加权系数w1至wN进行加权后,由加法器106相加以产生输出声音信号y,其中,目标声音信号得到了强调(步骤S13)。在时域中的数字信号处理中,加权用卷积表示。在这种情况下,加权系数w1至wN表示为滤波器系数wn={wn(0),wn(1)...,wn(L-1)},n=1,2,...N,其中,如果假设L为滤波长度,输出信号y可表示为通道的卷积和,如下面的公式(1)所示:y(t)=Σn=1N(xn(t)*wn)...(1)]]>-->其中,*表示卷积、并可用下面的公式(2)表示:xn(t)*wn=Σk=本文档来自技高网
...

【技术保护点】
一种声音信号处理方法,其包含:准备加权系数字典,该字典包含与多个特征量联系的多个加权系数,每一所述特征量表示多通道输入声音信号之间的差异;计算多通道输入声音信号中每两个之间的输入声音信号差异以获得多个输入特征量,每一所述输入 特征量指示所述输入声音信号差异;从所述加权系数字典中选择对应于所述输入特征量的多个加权系数;采用所述选择的加权系数对所述多通道输入声音信号进行加权;以及对所述加权后的输入声音信号进行相加以生成输出声音信号。

【技术特征摘要】
JP 2005-6-29 190272/20051.一种声音信号处理方法,其包含:准备加权系数字典,该字典包含与多个特征量联系的多个加权系数,每一所述特征量表示多通道输入声音信号之间的差异;计算多通道输入声音信号中每两个之间的输入声音信号差异以获得多个输入特征量,每一所述输入特征量指示所述输入声音信号差异;从所述加权系数字典中选择对应于所述输入特征量的多个加权系数;采用所述选择的加权系数对所述多通道输入声音信号进行加权;以及对所述加权后的输入声音信号进行相加以生成输出声音信号。2.根据权利要求1的方法,其中,获取所述多个特征量包含:基于所述多通道输入声音信号的通道间的到达时间差异来获取所述特征量。3.根据权利要求1的方法,其中,获取所述多个特征量包含:计算所述多通道输入声音信号的通道间的复相干性。4.根据权利要求1的方法,其进一步包含:在障碍物被布置在声音源与多个话筒之间的情况下,生成来自所述话筒的所述多通道输入声音信号。5.根据权利要求1的方法,其中,所述加权系数字典包含被确定为对来自扬声器的信号进行抑制的所述加权系数。6.根据权利要求1的方法,其中,所述加权系数对应于时域中的滤波器系数,且对所述多通道输入声音信号的加权用所述多通道输入声音信号和所述加权系数的卷积表示。7.根据权利要求1的方法,其中,所述加权系数对应于频域中的滤波器系数,且对所述多通道输入声音信号的加权用所述多通道输入声音信号和所述加权系数的乘积表示。8.一种声音信号处理方法,其包含:准备加权系数字典,该字典包含与多个特征量联系的多个加权系数,每一所述特征量表示多通道输入声音信号之间的差异;计算多通道输入声音信号中每两个之间的输入声音信号差异以获得多个输入特征量,每一所述输入特征量指示所述差异;对所述输入特征量进行聚类以生成多个聚类;计算每一所述聚类的质心;计算每一所述输入特征量与所述质心之间的距离以获得多个距离;从所述加权系数字典中选择加权系数,该加权系数对应于具有使所述距离最小化的质心的、所述聚类中的一个;采用所述选择的加权系数对所述多通道输入声音信号进行加权;以及对所述加权后的多通道输入声音信号进行相加以生成输出声音信号。9.根据权利要求8的方法,其中,获取所述多个特征量包含:基于所述多通道输入声音信号的通道间的到达时间差异来获取特征量。10.根据权利要求8的方法,其中,获取所述多个特征量包含:计算所述多通道输入声音信号的通道间的复相干性。11.根据权利要求8的方法,其进一步包含:计算多通道第二输入声音信号的通道间的差异,以获得多个第二特征量,每一所述第二特征量表示所述差异,所述多通道第二输入声音信号通过在改变学习位置的同时用话筒接收发自声音源的一系列声音来获得;对所述第二特征量进行聚类以生成多个第二聚类;通过所述加权系数字典的第二加权系数,对与所述第二聚类中的每一个相对应的所述多通道第二输入声音信号进行加权;将所述加权后的多通道第二输入声音信号进行相加以生成第二输出声音信号;以及在所述加权系数字典中记录使所述第二输出声音信号相对于目标信号的误差最小化的所述第二加权系数的加权系数。12.根据权利要求8的方法,其进一步包含:在障碍物被布置在声音源与多个话筒之间的情况下,生成来自所述话筒的所述多通道输入声音信号。...

【专利技术属性】
技术研发人员:天田皇
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利