一种多通道信号的相干声与环境声提取方法及系统技术方案

技术编号:25762526 阅读:80 留言:0更新日期:2020-09-25 21:10
本发明专利技术公开了一种多通道信号的相干声与环境声提取方法及系统,所述方法包括:计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;根据各个通道的相干声计算各个通道的环境声;将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。无论相干声能量所占比例大小、环境声在各个通道能量是否相等,本发明专利技术方法均可实现相干声与环境声提取,而且提取误差较小,精度高。

【技术实现步骤摘要】
一种多通道信号的相干声与环境声提取方法及系统
本专利技术涉及空间声重放领域,特别涉及一种多通道信号的相干声与环境声提取方法及系统。
技术介绍
空间声重放时,不仅需要满足一定的声源定位、声像宽度要求,还需形成良好的空间感和沉浸感。空间声主要包括具有方向性的相干声和具有扩散性的环境声两种成分。相干声与环境声的特性不同,人们对其感知也不同,因此为了实现更好的空间声重放效果,需要对相干声与环境声提取(Primary-AmbientExtraction,PAE)并进行不同的处理。PAE技术可以与空间音频场景编码、方向音频编码等空间音频编码系统相融合,已经成为空间声重放系统的关键技术之一。通常,PAE技术作为音频编码或解码的前端,可以实现复杂、有效而且具有沉浸感的空间声重放。首先,PAE技术将空间声场景中的相干声与环境声分离,可以使重放空间声的音频格式与原始的音频格式独立,增加空间声重放的灵活性。其次,对于基于目标的音频格式,基于PAE的声重放系统在不分离出单个声源目标的情况下,一样能重放出空间感较好的声场景,维持了空间声重放的效率性。最后,PAE技术分离出声场景中的两个重要组成成分,即相干声成分和环境声成分,对其分别处理可以在重构声场景时提升听觉体验。PAE可通过主成分分析法(PrincipalComponentAnalysis,PCA)完成,PCA法利用通道间的相关性,将输入信号的协方差矩阵的最大特征值对应的特征向量认定为相干声向量,对该向量进行归一化得到单位向量,输入信号向此单位向量做投影即可得到各个通道的相干声。PCA法的使用前提是相干声占主要能量,当相干声能量较少时提取误差增大。此外,当通道数较多时,输入信号的协方差矩阵的最大特征值对应的特征向量不易求解。除PCA法外,PAE中应用较广的另一种方法是最小二乘法(Least-Squares,LS)。由于使用LS法估计相干声时估计权重计算量较大,尤其是通道数较多时,无法计算估计权重,因此目前LS法仅用于立体声信号的PAE。成对相关法是专门针对多通道信号的PAE方法,此方法将多通道信号两两组对,并探究出各个通道的相干声能量占比与通道间相关值存在线性关系,利用通道间相关值求出各个通道的相干声能量占比,完成多通道信号的PAE。但是该方法仅使用了相关值的幅度信息,提取相干声的准确度不高。
技术实现思路
本专利技术的目的在于克服上述技术缺陷,提出了一种多通道信号的相干声与环境声提取方法。该方法通过计算通道数较少时使用最小二乘法估计相干声的权重,根据权重随通道数变化的规律性,得出针对任意通道数的多通道信号进行相干声估计时的权重表达式。此外,本专利技术的方法利用各个通道的信号能量以及通道间相关值,求出权重表达式中的各个未知参数,实现多通道信号的PAE。为实现上述目的,本专利技术的实施例1提供了一种多通道信号的相干声与环境声提取方法,所述方法包括:计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;根据各个通道的相干声计算各个通道的环境声;将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。作为上述方法的一种改进,所述计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;具体包括:将时域多通道信号进行傅里叶变换,第n个通道输入信号Xn表示为:Xn=βnS+An其中,S表示相干声的频谱,βn表示第n个通道的相干声与第一个通道的相干声存在的幅度差异因子,1≤n≤N,β1=1,An表示第n个通道的环境声的频谱;计算第n个通道输入信号Xn的短时能量计算任意两个通道间的相关值:其中,为第n1个通道和第n2个通道间的相关值,n1=1,2,…,N,n2=1,2,…,N,n1≠n2;共有个不同的互相关值;利用选取N组互相关值联立计算出各个通道中相干声所占比例为ηn;对于第一个通道,已知β1=1,因此有:其中,PS表示相干声的短时能量,表示第一个通道环境声的短时能量;对于其他通道,根据输入信号Xn的短时能量以及通道间相关值,得到:其中,表示第n个通道环境声的短时能量,其中n=2,3,…,N;计算第n个通道的权重值wn:则相干声的估计值为:则第n个通道相干声Sn:作为上述方法的一种改进,所述根据各个通道的相干声计算各个通道的环境声;具体为:第n个通道的环境声An为:An=Xn-Sn。本专利技术的实施例2提供了一种多通道信号的相干声与环境声提取系统,所述系统包括:相干声提取模块,用于计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;环境声提取模块,用于根据各个通道的相干声计算各个通道的环境声;频域转时域模块,用于将所N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。作为上述系统的一种改进,所述相干声提取模块的具体实现过程为:将时域多通道信号进行傅里叶变换,第n个通道输入信号Xn表示为:Xn=βnS+An其中,S表示相干声的频谱,βn表示第n个通道的相干声与第一个通道的相干声存在的幅度差异因子,1≤n≤N,β1=1,An表示第n个通道的环境声的频谱;计算第n个通道输入信号Xn的短时能量计算任意两个通道间的相关值:其中,为第n1个通道和第n2个通道间的相关值,n1=1,2,…,N,n2=1,2,…,N,n1≠n2;共有个不同的互相关值;利用选取N组互相关值联立计算出各个通道中相干声所占比例为ηn;对于第一个通道,已知β1=1,因此有:其中,PS表示相干声的短时能量,表示第一个通道环境声的短时能量;对于其他通道,根据输入信号Xn的短时能量以及通道间相关值,得到:其中,表示第n个通道环境声的短时能量,其中n=2,3,…,N;计算第n个通道的权重值wn:则相干声的估计值为:则第n个通道相干声Sn:作为上述系统的一种改进,所述环境声提取模块的具体实现过程为:第n个通道的环境声An为:An=Xn-Sn。本专利技术的优势在于:无论相干声能量所占比例大小、环境声在各个通道能量是否相等,本专利技术方法均可实现相干声和环境声的提取,而且提取误差较小,精度高。附图说明图1是本专利技术的多通道信号的相干声与环境声提取方法的流程图;图2(a)是使用本专利技术的方法和成对相关法对混合五通道信号1进行相干声成分提取的误差图;图2(b)是使用本专利技术的方法和成对相关法对混合五通道信号1进行环境声成分提取的误差图;图3(a)是使用本专利技术的方法和成对相关法本文档来自技高网
...

【技术保护点】
1.一种多通道信号的相干声与环境声提取方法,所述方法包括:/n计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;/n根据各个通道的相干声计算各个通道的环境声;/n将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。/n

【技术特征摘要】
1.一种多通道信号的相干声与环境声提取方法,所述方法包括:
计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;
根据各个通道的相干声计算各个通道的环境声;
将N个通道相干声与N个通道环境声进行逆傅里叶变换,得到时域表示的相干声与环境声。


2.根据权利要求1所述的多通道信号的相干声与环境声提取方法,其特征在于,所述计算N个通道信号相干声的权重表达式,根据权重表达式估计相干声,由此计算各个通道的相干声;具体包括:
将时域多通道信号进行傅里叶变换,第n个通道输入信号Xn表示为:
Xn=βnS+An
其中,S表示相干声的频谱,βn表示第n个通道的相干声与第一个通道的相干声存在的幅度差异因子,1≤n≤N,β1=1,An表示第n个通道的环境声的频谱;
计算第n个通道输入信号Xn的短时能量



计算任意两个通道间的相关值:



其中,为第n1个通道和第n2个通道间的相关值,n1=1,2,…,N,n2=1,2,…,N,n1≠n2;共有个不同的互相关值;
利用选取N组互相关值联立计算出各个通道中相干声所占比例为ηn;
对于第一个通道,已知β1=1,因此有:






其中,PS表示相干声的短时能量,表示第一个通道环境声的短时能量;
对于其他通道,根据输入信号Xn的短时能量以及通道间相关值,得到:






其中,表示第n个通道环境声的短时能量,其中n≥2;
计算第n个通道的权重值wn:



则相干声的估计值为:



则第n个通道相干声Sn:


3.根据权利要求2所述的多通道信号的相干声与环境声提取方法,其特征在于,所述根据各个通道的相干声计算各个通道的环境声;具体为:
第n个通道的环境声An为:
An=Xn-Sn。

【专利技术属性】
技术研发人员:吴彦琴桑晋秋郑成诗张芳杰李晓东
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1