本发明专利技术公开了一种多元混合声信号分离方法及装置,所述多元混合声信号分离方法至少包括:通过短时傅里叶变换,获得混合声信号和真实源信号的幅度谱和相位谱;通过生成器对所述混合声信号幅度谱进行训练,获得所述估计分离信号幅度谱;通过判别器对所述估计分离信号幅度谱与所述真实源信号幅度谱进行训练,并判断所述估计分离信号幅度谱是否为真实输出,若是,通过所述估计分离信号幅度谱与所述混合声信号相位谱,获得分离声信号,同时获得生成器优化函数对所述生成器进行优化直至到达最大迭代次数。本发明专利技术公开的多元混合声信号分离方法及装置提高了所述分离声信号的可懂度,且算法的泛化能力好,具有很强的抗干扰性。
【技术实现步骤摘要】
一种多元混合声信号分离方法及装置
本专利技术涉及声信号分离
,具体来说是一种多元混合声信号分离方法及装置。
技术介绍
传统的信号处理方法包括谱减法、维纳滤波法等,均是在假定目标声源与噪声先验分布的条件下,估计目标声源的短时傅里叶系数,为了更好地表述噪声的先验分布,通常假设噪声是平稳的或者是慢变的,然而实际情况下该假设条件很难满足,即在低信噪比条件下分离性能会严重下降。随着人工智能及大数据时代的到来,声信号的采集量越来越多,如何利用大量的已知混合多元声信号及单目标声信号的真实数据提高分离性能,使得分离算法更具有实用性,从而提高声信号监测系统对声学事件的检测率成为了多元声信号分离领域的迫切的目标。
技术实现思路
本专利技术的目的在于提供一种多元混合声信号分离方法及装置,解决现有技术中声信号分离模型收敛困难、实用性差能量损失严重问题。实现多源声音信号的分离。为解决上述技术问题,本专利技术是通过以下技术方案实现的:本专利技术提供的一种多元混合声信号分离方法,其至少包括以下步骤:S1:采集混合声信号与真实源信号;S2:通过所述混合声信号与真实源信号,获得混合声信号幅度谱、混合声信号相位谱和真实源信号幅度谱;S3:通过生成器对所述混合声信号幅度谱进行训练,获得所述估计分离信号幅度谱;S4:通过判别器对所述估计分离信号幅度谱与所述真实源信号幅度谱进行训练,并判断所述估计分离信号幅度谱是否为真实输出,若是,则输出所述估计分离信号幅度谱,并执行步骤S5,若否,则执行步骤S6;S5:通过所述估计分离信号幅度谱与所述混合声信号相位谱,获得分离声信号;S6:通过所述判别器对所述生成器进行更新处理,对此步骤进行迭代,并判断迭代次数是否达到预设最大迭代次数,若是,则结束,若否,则迭代次数增加,并继续执行步骤S3。在本专利技术一实施例中,所述多元混合声信号分离方法包括混合声信号模型的建立,所述混合声信号模型为:其中,x(t)为混合声信号,Si(t)为第i个真实源信号,hi(t)第i个真实源信号到传感器间传递函数,e(t)为噪声,K为真实源信号个数,i为真实源信号序号,t为时间,T为信号时间长度。在本专利技术一实施例中,所述多元混合声信号分离方法包括分离信号的分析模型的建立,其建立方法包括:将所述混合声信号幅度谱作为生成器的输入,获得所述估计分离信号幅度谱,将其与真实源信号幅度谱一同输入判别器,同时将判别器的判别结果反馈给生成器。在本专利技术一实施例中,所述多元混合声信号分离方法包括构建生成对抗网络模型,通过所述生成对抗网络模型对所述分离信号的分析模型求解,其中所述生成对抗网络模型包括生成器和判别器。在本专利技术一实施例中,判断所述估计分离信号是否为真实输出的条件是:所述生成对抗网络模型是否收敛,若所述生成对抗网络模型收敛,则所述估计分离信号为真实输出,若否,则所述估计分离信号为非真实输出。在本专利技术一实施例中,所述多元混合声信号分离方法包括:利用判别器生成的生成器优化函数对所述生成器进行优化,所述生成器优化函数为:其中,t为时间,f为频率,x(t,f)为混合声信号幅度谱,q(x(t,f))为x(t,f满足的概率密度函数,为第i个估计分离信号幅度谱,K为真实源信号个数,i为真实源信号序号,表示期望,D(·)表示判别器函数,λ表示增益,||·||表示范数。在本专利技术一实施例中,获得所述估计分离信号幅度谱后,将所述估计分离信号幅度谱与所述混合声信号相位谱结合得到所述分离声信号。在本专利技术一实施例中,通过生成器的训练,在混合声信号中分离出多个源声音信号的估计分离信号幅度谱,采用多个判别器对所述多个源声音信号的估计分离信号幅度谱同时进行训练。在本专利技术一实施例中,对所述分离声信号进行评估的指标包括:信失比、信干比和信伪比;其中信失比反映分离整体性能;信干比反映恢复源信号中由其它信号未移除残留引入干扰误差;信伪比为分离算法本身引起计算误差。本专利技术还提供一种多元声音信号的分离装置,其特征在于,所述多元声音信号的分离装置包括:存储器:用于存储所述多元混合声信号分离方法;处理器:用于执行所述存储器中的所述多元混合声信号分离方法。如上所述本专利技术提供的一种多元混合声信号分离方法及装置,采用生成器和判断器形成生成对抗网络模型,以多元混合声信号的短时傅里叶幅度谱为生成器的输入先验特征,得到分离后的目标声信号,并通过判别器进行纳什平衡,以联合概率分布KL散度(Kullback-LeiblerDivergence)最小为真实声信号与生成器分离的估计声信号的衡量准则,导出设计了基于能量约束项的生成器改进代价函数,从而实现声信号分离。本专利基于联合概率分布KL散度变分多元分离算法在生成对抗网络上的应用极大地提高了分离后声信号的可懂度,且算法的泛化能力好,具有很强的抗干扰性。当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为一种多元混合声信号分离方法流程图。图2为对抗网络生成原理框图。图3为多判别器并行训练原理框图。图4为生成器设计框图。图5为判别器设计框图。图6为本专利技术算法流程图。图7为本专利技术提出的算法与其他分离算法结果的SDR、SIR、SAR比较图。图8为本专利技术提供的一种真实信号时域波形图。图9为本专利技术提供的另一种真实信号时域波形图。图10为本专利技术提供的混合声信号时域波形图。图11为本专利技术提供的一种真实信号短时傅里叶变换语谱图。图12为本专利技术提供的另一种真实信号短时傅里叶变换语谱图。图13为本专利技术提供的混合声信号短时傅里叶变换语谱图。图14为原始FT1000生成对抗网络结果图。图15为原始GAN对于FT1000生成对抗网络结果图。图16为本专利技术提出的算法对于FT1000生成对抗网络结果图。图17为原始FT1400生成对抗网络结果图。图18为原始GAN对于FT1400生成对抗网络结果图。图19为本专利技术提出的算法对于FT1400生成对抗网络结果图。图20为一种多元声音信号的分离装置结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。多元声信号分离模型起源于“鸡尾酒会”问题,在多个声信号同时存在的情况下分离出目标声信号,即假设混合本文档来自技高网...
【技术保护点】
1.一种多元混合声信号分离方法,其特征在于,其至少包括以下步骤:/nS1:采集混合声信号与真实源信号;/nS2:通过所述混合声信号与真实源信号,获得混合声信号幅度谱、混合声信号相位谱和真实源信号幅度谱;/nS3:通过生成器对所述混合声信号幅度谱进行训练,获得所述估计分离信号幅度谱;/nS4:通过判别器对所述估计分离信号幅度谱与所述真实源信号幅度谱进行训练,并判断所述估计分离信号幅度谱是否为真实输出,若是,则输出所述估计分离信号幅度谱,并执行步骤S5,若否,则执行步骤S6;/nS5:通过所述估计分离信号幅度谱与所述混合声信号相位谱,获得分离声信号,并执行步骤S6;/nS6:通过所述判别器对所述生成器进行更新处理,对此步骤进行迭代,并判断迭代次数是否达到预设最大迭代次数,若是,则结束,若否,则迭代次数增加,并继续执行步骤S3。/n
【技术特征摘要】
1.一种多元混合声信号分离方法,其特征在于,其至少包括以下步骤:
S1:采集混合声信号与真实源信号;
S2:通过所述混合声信号与真实源信号,获得混合声信号幅度谱、混合声信号相位谱和真实源信号幅度谱;
S3:通过生成器对所述混合声信号幅度谱进行训练,获得所述估计分离信号幅度谱;
S4:通过判别器对所述估计分离信号幅度谱与所述真实源信号幅度谱进行训练,并判断所述估计分离信号幅度谱是否为真实输出,若是,则输出所述估计分离信号幅度谱,并执行步骤S5,若否,则执行步骤S6;
S5:通过所述估计分离信号幅度谱与所述混合声信号相位谱,获得分离声信号,并执行步骤S6;
S6:通过所述判别器对所述生成器进行更新处理,对此步骤进行迭代,并判断迭代次数是否达到预设最大迭代次数,若是,则结束,若否,则迭代次数增加,并继续执行步骤S3。
2.根据权利要求1所述一种多元混合声信号分离方法,其特征在于,所述多元混合声信号分离方法包括混合声模型的建立,所述混合声模型的建立方法为:
其中,x(t)为混合声信号,Si(t)为第i个真实源信号,hi(t)第i个真实源信号到传感器间传递函数,e(t)为噪声,K为真实源信号个数,i为真实源信号序号,t为时间,T为信号时间长度。
3.根据权利要求1所述一种多元混合声信号分离方法,其特征在于,所述多元混合声信号分离方法包括分离信号的分析模型的建立,其建立方法包括:将所述混合声信号幅度谱作为生成器的输入,获得所述估计分离信号幅度谱,将其与真实源信号幅度谱一同输入判别器,同时将判别器的判别结果反馈给生成器。
4.根据权利要求3所述一种多元混合声信号分离方法,其特征在于,所述多元混合声信号分离方法包括构建生成对抗网络模型,通过所述生成对抗网络模型对所述分离信号的分析模型求解,其中所述生成对抗网络模型包括生成器和...
【专利技术属性】
技术研发人员:宋广伟,鲍明,许耀华,王翊,蒋芳,胡艳军,
申请(专利权)人:安徽大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。