一种消除混响的方法和系统技术方案

技术编号：23162915 阅读：94 留言：0更新日期：2020-01-21 22:13

本发明专利技术提供了一种消除混响的方法，该消除混响的方法和系统通过在消除混响的过程中引入关于语音信号的语音时频概率检测，以计算得到该语音信号的语音时频概率，并根据该语音时频概率对混响消除处理中使用的滤波器进行适应性的更新调整操作，这样能够有效地降低滤波器发生更新错误的概率和降低该滤波器的计算频率和减少消除混响的计算量，从而便于对消除混响的计算量进行大幅度压缩和提高消除混响算法在不同类型处理器中的适用性。

全部详细技术资料下载

【技术实现步骤摘要】
一种消除混响的方法和系统
本专利技术涉及声音信号处理的
，特别涉及一种消除混响的方法和系统。
技术介绍
当声波在传播过程中遇到墙体、地面和物品后，会发生多次反射才到达相应的传声器中，该传声器除了接收到来自声源的直达声波外，还会接收到大量反射声波，并且这些反射声波同时也构成相应的混响成分。通常来说，早期混响成分能够使声音信号更加饱满，而晚期混响成分则会大幅度降低声音信号的可识别性以及影响声音信号的听感，因此现有的混响消除技术主要是针对晚期混响成分。虽然，现有的消除晚期混响成分的技术能够有效地抑制晚期混响成分，但是该技术设计的在线算法在噪声较强且为相干噪声的情况下，会将声音滤波器更新到错误的方向，从而使得不能有效地消除混响成分，并且还会对声音信号造成损害和降低声音信号的可识别性能，还有由于该在线算法对于混响成分消除的多寡与滤波器的长度相关，并且当滤波器的阶数较高时，其涉及的计算量十分巨大，从而限制了在低运算能力的处理器上运行该在线算法。可见，现有技术并不能实现对混响成分、特别是高阶混响成分的准确和高效消除处理。r>专利技术本文档来自技高网...

【技术保护点】
1.一种消除混响的方法，其特征在于，所述消除混响的方法包括如下步骤：/n步骤(1)，对目标语音信号进行预处理，并获取经过所述预处理的目标语音信号对应的语音时频概率；/n步骤(2)，根据所述语音时频概率，调整作用到所述目标语音信号的滤波处理；/n步骤(3)，根据调整后的所述滤波处理，抑制所述目标语音信号对应语音阵列数据中存在的混响分量。/n

【技术特征摘要】
1.一种消除混响的方法，其特征在于，所述消除混响的方法包括如下步骤：
步骤(1)，对目标语音信号进行预处理，并获取经过所述预处理的目标语音信号对应的语音时频概率；
步骤(2)，根据所述语音时频概率，调整作用到所述目标语音信号的滤波处理；
步骤(3)，根据调整后的所述滤波处理，抑制所述目标语音信号对应语音阵列数据中存在的混响分量。

2.如权利要求1所述的消除混响的方法，其特征在于：
在所述步骤(1)中，对目标语音信号进行预处理，并获取经过所述预处理的目标语音信号对应的语音时频概率具体包括，
步骤(101)，对所述目标语音信号进行晚期混响抑制处理，以消除所述目标语音信号中的晚期混响分量；
步骤(102)，对经过所述晚期混响抑制处理后的所述目标语音信号进行语音时频概率计算处理，以得到所述语音时频概率，其中，所述语音时频概率计算处理是通过深度学习模型实现的，所述深度学习模型的构建过程包括，
S1、将干净语音数据x和噪声数据n混合得到带噪语音数据y，将所述干净语音数据x的每帧干净语音信号和所述带噪语音数据y的每帧混合语音信号分解到频域，以分别得到相应的干净语音频域数据X和带噪语音频域数据Y；
S2、对于所述干净语音频域数据X和所述带噪语音频域数据Y，计算所述带噪语音频域数据Y相对于所述干净语音频域数据X在每个频点k对应的概率值p(k)＝abs(Y(k))/abs(X(k))，其中abs(X(k))为所述干净语音频域数据X对于每个频点k的概率值，abs(Y(k))为所述带噪语音频域数据Y对于每个频点k的概率值；
S3、根据所述带噪语音频域数据Y相对于所述干净语音频域数据X在每个频点k对应的所有概率值，构建得到所述深度学习模型。

3.如权利要求1所述的消除混响的方法，其特征在于：
在所述步骤(2)中，根据所述语音时频概率，调整作用到所述目标语音信号的滤波处理具体包括，
步骤(201)，根据所述语音时频概率，判断所述目标语音信号对应的若干帧语音数据中的每一个的可用状态；
步骤(202)，根据所述目标语音信号中每一帧语音数据的可用状态判断结果，确定所述目标语音数据对应的FIFO数据缓冲区的数据缓冲评判值；
步骤(203)，根据所述数据缓冲评判值，确定是否调整所述滤波处理。

4.如权利要求3所述的消除混响的方法，其特征在于：
在所述步骤(201)中，根据所述语音时频概率，判断所述目标语音信号对应的若干帧语音数据中的每一个的可用状态具体包括，
步骤(2011)，将所述语音时频概率与预设概率门限值进行对比处理，并根据所述对比处理的结果，判断所述目标语音信号中每一帧语音数据的可用状态；
步骤(2022)，若所述语音时频概率大于所述预设概率门限值，则判断所述目标语音信号中对应帧语音数据处于可用状态；
步骤(2023)，若所述语音时频概率小于或者等于所述预设概率门限值，则判断所述目标语音信号中对应帧语音数据处于不可用状态；
或者，
在所述步骤(202)中，根据所述目标语音信号中每一帧语音数据的可用状态判断结果，确定所述目标语音数据对应的FIFO数据缓冲区的数据缓冲评判值具体包括，
步骤(2021)，根据所述可用状态判断结果，确定所述目标语音信息中处于可用状态的所有帧语音数据在所述FIFO数据缓冲区的数据存储状态；
步骤(2022)，根据处于可用状态的所有帧语音数据在所述FIFO数据缓冲区的数据存储状态，确定处于可用状态的每一帧语音数据对应的数据缓冲评判值；
或者，
在所述步骤(203)中，根据所述数据缓冲评判值，确定是否调整所述滤波处理具体包括，
步骤(2031)，将所述数据缓冲评价值与预设评价门限值进行对比处理，并根据所述对比处理的结果，判断是否更新所述滤波处理；
步骤(2032)，若所述数据缓冲评价值超过所述预设评价门限值，则更新所述滤波处理；
步骤(2033)，若所述数据缓冲评价值不超过所述预设评价门限值，则不更...

【专利技术属性】
技术研发人员：关海欣，
申请(专利权)人：云知声智能科技股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人