【技术实现步骤摘要】
声音信号处理方法和装置
本专利技术涉及一种用于强调输入声音信号中的目标语音信号并输出经强调后的语音信号的声音信号处理方法及装置。
技术介绍
当语音识别技术被用于实际环境中时,周围的噪音对语音识别率有着很大的影响。存在着多种噪音,例如发动机声音(风噪音)、对向的车辆的声音、经过的车辆的声音、车辆中车辆音频装置的声音。这些噪音被混合在说话者的话音之中并被输入到语音识别系统中,由此导致识别率的大为下降。话筒阵列的采用被认为是解决这样一种噪音问题的方法。话筒阵列使来自多个话筒的输入声音信号受到信号处理以便对目标语音信号进行强调并输出经强调后的语音信号,其中,目标语音信号为说话者的话音。众所周知,适应型话筒阵列通过自动将话筒的接收声音灵敏度较低的死角(null)转向噪音到来的方向来抑制噪音。适应型话筒阵列在这样的条件(约束条件)下设计:目标声音方向的信号通常不被抑制。结果,可以在不抑制来自话筒阵列正面方向的目标语音信号的情况下抑制来自话筒阵列侧面的噪音。然而,存在所谓的残响(reverberation)问题,即在实际环境中,位于话筒阵列正面的说话者的话音被说话者周围的障碍物例如墙壁等反射,且来自各种方向的话音分量进入话筒。在传统的适应型话筒阵列中没有考虑到残响。结果,当适应型话筒阵列在残响情况下应用时,存在具有被称作“目标信号消除”现象的问题,即应当被强调的目标语音信号不正确地被抑制了。-->如果残响的影响已知,即从声音源到话筒的传递函数已知,人们设想出一种可以防止目标信号消除问题的方法。例如,J.L.Flanagan、A.C.Surendran和E.E.Jan在 ...
【技术保护点】
一种声音信号处理方法,其包含:准备加权系数字典,该字典包含与多个特征量联系的多个加权系数,每一所述特征量表示多通道输入声音信号之间的差异;计算多通道输入声音信号中每两个之间的输入声音信号差异以获得多个输入特征量,每一所述输入 特征量指示所述输入声音信号差异;从所述加权系数字典中选择对应于所述输入特征量的多个加权系数;采用所述选择的加权系数对所述多通道输入声音信号进行加权;以及对所述加权后的输入声音信号进行相加以生成输出声音信号。
【技术特征摘要】
JP 2005-6-29 190272/20051.一种声音信号处理方法,其包含:准备加权系数字典,该字典包含与多个特征量联系的多个加权系数,每一所述特征量表示多通道输入声音信号之间的差异;计算多通道输入声音信号中每两个之间的输入声音信号差异以获得多个输入特征量,每一所述输入特征量指示所述输入声音信号差异;从所述加权系数字典中选择对应于所述输入特征量的多个加权系数;采用所述选择的加权系数对所述多通道输入声音信号进行加权;以及对所述加权后的输入声音信号进行相加以生成输出声音信号。2.根据权利要求1的方法,其中,获取所述多个特征量包含:基于所述多通道输入声音信号的通道间的到达时间差异来获取所述特征量。3.根据权利要求1的方法,其中,获取所述多个特征量包含:计算所述多通道输入声音信号的通道间的复相干性。4.根据权利要求1的方法,其进一步包含:在障碍物被布置在声音源与多个话筒之间的情况下,生成来自所述话筒的所述多通道输入声音信号。5.根据权利要求1的方法,其中,所述加权系数字典包含被确定为对来自扬声器的信号进行抑制的所述加权系数。6.根据权利要求1的方法,其中,所述加权系数对应于时域中的滤波器系数,且对所述多通道输入声音信号的加权用所述多通道输入声音信号和所述加权系数的卷积表示。7.根据权利要求1的方法,其中,所述加权系数对应于频域中的滤波器系数,且对所述多通道输入声音信号的加权用所述多通道输入声音信号和所述加权系数的乘积表示。8.一种声音信号处理方法,其包含:准备加权系数字典,该字典包含与多个特征量联系的多个加权系数,每一所述特征量表示多通道输入声音信号之间的差异;计算多通道输入声音信号中每两个之间的输入声音信号差异以获得多个输入特征量,每一所述输入特征量指示所述差异;对所述输入特征量进行聚类以生成多个聚类;计算每一所述聚类的质心;计算每一所述输入特征量与所述质心之间的距离以获得多个距离;从所述加权系数字典中选择加权系数,该加权系数对应于具有使所述距离最小化的质心的、所述聚类中的一个;采用所述选择的加权系数对所述多通道输入声音信号进行加权;以及对所述加权后的多通道输入声音信号进行相加以生成输出声音信号。9.根据权利要求8的方法,其中,获取所述多个特征量包含:基于所述多通道输入声音信号的通道间的到达时间差异来获取特征量。10.根据权利要求8的方法,其中,获取所述多个特征量包含:计算所述多通道输入声音信号的通道间的复相干性。11.根据权利要求8的方法,其进一步包含:计算多通道第二输入声音信号的通道间的差异,以获得多个第二特征量,每一所述第二特征量表示所述差异,所述多通道第二输入声音信号通过在改变学习位置的同时用话筒接收发自声音源的一系列声音来获得;对所述第二特征量进行聚类以生成多个第二聚类;通过所述加权系数字典的第二加权系数,对与所述第二聚类中的每一个相对应的所述多通道第二输入声音信号进行加权;将所述加权后的多通道第二输入声音信号进行相加以生成第二输出声音信号;以及在所述加权系数字典中记录使所述第二输出声音信号相对于目标信号的误差最小化的所述第二加权系数的加权系数。12.根据权利要求8的方法,其进一步包含:在障碍物被布置在声音源与多个话筒之间的情况下,生成来自所述话筒的所述多通道输入声音信号。...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。