一种多通道信号的相干声与环境声提取方法及系统技术方案

技术编号：25762526 阅读：80 留言：0更新日期：2020-09-25 21:10

本发明专利技术公开了一种多通道信号的相干声与环境声提取方法及系统，所述方法包括：计算N个通道信号相干声的权重表达式，根据权重表达式估计相干声，由此计算各个通道的相干声；根据各个通道的相干声计算各个通道的环境声；将N个通道相干声与N个通道环境声进行逆傅里叶变换，得到时域表示的相干声与环境声。无论相干声能量所占比例大小、环境声在各个通道能量是否相等，本发明专利技术方法均可实现相干声与环境声提取，而且提取误差较小，精度高。

全部详细技术资料下载

【技术实现步骤摘要】
一种多通道信号的相干声与环境声提取方法及系统
本专利技术涉及空间声重放领域，特别涉及一种多通道信号的相干声与环境声提取方法及系统。
技术介绍
空间声重放时，不仅需要满足一定的声源定位、声像宽度要求，还需形成良好的空间感和沉浸感。空间声主要包括具有方向性的相干声和具有扩散性的环境声两种成分。相干声与环境声的特性不同，人们对其感知也不同，因此为了实现更好的空间声重放效果，需要对相干声与环境声提取(Primary-AmbientExtraction,PAE)并进行不同的处理。PAE技术可以与空间音频场景编码、方向音频编码等空间音频编码系统相融合，已经成为空间声重放系统的关键技术之一。通常，PAE技术作为音频编码或解码的前端，可以实现复杂、有效而且具有沉浸感的空间声重放。首先，PAE技术将空间声场景中的相干声与环境声分离，可以使重放空间声的音频格式与原始的音频格式独立，增加空间声重放的灵活性。其次，对于基于目标的音频格式，基于PAE的声重放系统在不分离出单个声源目标的情况下，一样能重放出空间感较好的声场景，维持了空间声重放的效率性。最后，PAE技术分离出声场景中的两个重要组成成分，即相干声成分和环境声成分，对其分别处理可以在重构声场景时提升听觉体验。PAE可通过主成分分析法(PrincipalComponentAnalysis,PCA)完成，PCA法利用通道间的相关性，将输入信号的协方差矩阵的最大特征值对应的特征向量认定为相干声向量，对该向量进行归一化得到单位向量，输入信号向此单位向量做投影即可得到各个通道的...

【技术保护点】
1.一种多通道信号的相干声与环境声提取方法，所述方法包括：/n计算N个通道信号相干声的权重表达式，根据权重表达式估计相干声，由此计算各个通道的相干声；/n根据各个通道的相干声计算各个通道的环境声；/n将N个通道相干声与N个通道环境声进行逆傅里叶变换，得到时域表示的相干声与环境声。/n

【技术特征摘要】
1.一种多通道信号的相干声与环境声提取方法，所述方法包括：
计算N个通道信号相干声的权重表达式，根据权重表达式估计相干声，由此计算各个通道的相干声；
根据各个通道的相干声计算各个通道的环境声；
将N个通道相干声与N个通道环境声进行逆傅里叶变换，得到时域表示的相干声与环境声。

2.根据权利要求1所述的多通道信号的相干声与环境声提取方法，其特征在于，所述计算N个通道信号相干声的权重表达式，根据权重表达式估计相干声，由此计算各个通道的相干声；具体包括：
将时域多通道信号进行傅里叶变换，第n个通道输入信号Xn表示为：
Xn＝βnS+An
其中，S表示相干声的频谱，βn表示第n个通道的相干声与第一个通道的相干声存在的幅度差异因子，1≤n≤N，β1＝1，An表示第n个通道的环境声的频谱；
计算第n个通道输入信号Xn的短时能量

计算任意两个通道间的相关值：

其中，为第n1个通道和第n2个通道间的相关值，n1＝1,2,…,N,n2＝1,2,…,N,n1≠n2；共有个不同的互相关值；
利用选取N组互相关值联立计算出各个通道中相干声所占比例为ηn；
对于第一个通道，已知β1＝1，因此有：

其中，PS表示相干声的短时能量，表示第一个通道环境声的短时能量；
对于其他通道，根据输入信号Xn的短时能量以及通道间相关值，得到：

其中，表示第n个通道环境声的短时能量，其中n≥2；
计算第n个通道的权重值wn：

则相干声的估计值为：

则第n个通道相干声Sn：

3.根据权利要求2所述的多通道信号的相干声与环境声提取方法，其特征在于，所述根据各个通道的相干声计算各个通道的环境声；具体为：
第n个通道的环境声An为：
An＝Xn-Sn。

【专利技术属性】
技术研发人员：吴彦琴，桑晋秋，郑成诗，张芳杰，李晓东，
申请(专利权)人：中国科学院声学研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人