处理声音数据以分离多声道信号中的声源制造技术

技术编号：23154571 阅读：82 留言：0更新日期：2020-01-18 15:32

本发明专利技术涉及一种用于处理声音数据以分离在真实介质中感测到的多声道声音信号的N个声源的方法。该方法包括以下步骤：将源分离处理应用(E310)于所感测到的多声道信号，并获得分离矩阵和一组M个声音分量，其中，M≥N；计算(E320)一组所谓的双变量第一描述符，该组所谓的双变量第一描述符表示所获得的该组M个分量的对中的分量之间的统计关系；计算(E320)一组所谓的单变量第二描述符，该组所谓的单变量第二描述符表示所获得的该组M个分量中的分量的编码特性；以及根据该组第一描述符和该组第二描述符、通过对属于两个类别之一中的成员的概率的计算(E330)、根据分量的这两个类别来将该组M个分量中的分量进行分类(E340)，第一类别具有对应于这N个直接声源的N个所谓的直接分量，并且第二类别具有M‑N个所谓的混响分量。本发明专利技术还涉及一种实施比如所描述的方法的处理设备。

Processing sound data to separate sound sources in multichannel signals

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】处理声音数据以分离多声道信号中的声源
本专利技术涉及音频信号或声学信号处理领域，并且更具体地涉及对真实的多声道声音内容进行处理以便分离声源。
技术介绍
分离多声道声音信号中的源可以实现许多应用。例如，其可以用于：ο娱乐(卡拉OK：语音抑制)，ο音乐(混合多声道内容中的不同源)，ο远程通信(语音增强、噪声消除)，ο家庭自动化(语音控制)，ο多声道音频编码，ο成像中的源定位和制图。在N个源正在发射信号si的空间E中，基于来自分布在该空间E中的传感器的M个观测结果，对这些源进行盲分离在于对这N个源进行计数和提取。在实践中，每个观测结果都是使用传感器获得的，该传感器记录已到达空间中的该传感器所在的点的信号。所记录的信号则由信号si的混合以及这些信号在空间E中的传播产生，并且因此受到特定于所经历的环境的各种扰动(如例如噪声、混响、干扰)的影响。对在自由场条件下传播并被认为是多个点的N个声源si的多声道捕获被形式化为矩阵运算：其中，x是M个所记录声道的向量，s是N个源的向量，并且A是大小为M×N的被称为“混合矩阵”的矩阵，该矩阵包含每个源对每个观测结果的贡献，并且符号*表示线性卷积。取决于传播环境和天线的格式，矩阵A可以采用各种形式。在天线重合的情况下(天线的所有麦克风集中在空间中的同一点上)，在消声环境中，A是简单的增益矩阵。在天线非重合的情况下，在消声环境或混响环境中，矩阵A变为滤波矩阵。在这种情况下，这种关系在频域中通常被表示为x(f)＝As(...

【技术保护点】
1.一种用于处理声音数据以分离在真实环境中捕获的多声道声音信号的N个声源的方法，其特征在于，该方法包括以下步骤：/n-将源分离处理应用(E310)于所捕获的多声道信号，并获得分离矩阵和一组M个声音分量，其中，M≥N；/n-计算(E320)一组所谓的双变量第一描述符，该组双变量第一描述符表示所获得的该组M个分量的对中的分量之间的统计关系；/n-计算(E320)一组所谓的单变量第二描述符，该组所谓的单变量第二描述符表示所获得的该组M个分量中的分量的编码特性；/n-根据该组第一描述符和该组第二描述符，使用对属于两个类别之一的概率的计算(E330)来将该组M个分量分类(E340)为这两个类别的分量，第一类别具有被称为直接分量的、对应于这N个直接声源的N个分量，并且第二类别具有被称为混响分量的M-N个分量。/n

【技术特征摘要】
【国外来华专利技术】20170609 FR 17551831.一种用于处理声音数据以分离在真实环境中捕获的多声道声音信号的N个声源的方法，其特征在于，该方法包括以下步骤：
-将源分离处理应用(E310)于所捕获的多声道信号，并获得分离矩阵和一组M个声音分量，其中，M≥N；
-计算(E320)一组所谓的双变量第一描述符，该组双变量第一描述符表示所获得的该组M个分量的对中的分量之间的统计关系；
-计算(E320)一组所谓的单变量第二描述符，该组所谓的单变量第二描述符表示所获得的该组M个分量中的分量的编码特性；
-根据该组第一描述符和该组第二描述符，使用对属于两个类别之一的概率的计算(E330)来将该组M个分量分类(E340)为这两个类别的分量，第一类别具有被称为直接分量的、对应于这N个直接声源的N个分量，并且第二类别具有被称为混响分量的M-N个分量。

2.如权利要求1所述的方法，其中，计算双变量描述符包括计算两个分量之间的相干性得分。

3.如权利要求1和2中任一项所述的方法，其中，计算双变量描述符包括确定一对中的两个分量之间的延迟。

4.如权利要求3所述的方法，其中，两个分量之间的延迟是通过考虑使该对中的这两个分量之间的互相关函数最大化的延迟来确定的。

5.如权利要求3和4中任一项所述的方法，其中，一对中的两个分量之间的延迟的确定与该延迟的符号的可靠性指标相关联，该指标取决于该对中的分量之间的相干性。

6.如权利要求3和5中任一项所述的方法，其中，一对中的两个分量之间的延迟的确定与该延迟的符号的可靠性指标相关联，该指标取决于具有相反符号的延迟的互相关函数的最大值的比率。

7.如权利要求1至6之一所述的方法，其中，对单变量描述符的计算取决于基于源分离步骤所估计的混合矩阵的混合系数与平面波源的编码特征之间的匹配。

8.如权利要求1至7之一所述的方法，其中，该组M个分量中的分量是通过考虑该组M个分量并通过计算这M个分量的分类的最可能组合来分类的。...

【专利技术属性】
技术研发人员：M巴奎，A格林，
申请(专利权)人：奥兰治，
类型：发明
国别省市：法国;FR

全部详细技术资料下载我是这个专利的主人