The technology relates to sound source separation devices, methods and procedures capable of achieving higher separation performance. The sound source separation device includes a combination unit which combines the first sound source separation signal of a predetermined sound source with the second sound source separation signal of the sound source. The first sound source separation signal is separated from the mixed sound signal by the first sound source separation system, and the second sound source separation signal is separated from the mixed sound signal by the second sound source separation system within a predetermined time unit. The separation performance of the second sound source separation system is different from that of the first sound source separation system, and the sound source separation signal obtained by the combination is output. The technology can be applied to sound source separation device.
【技术实现步骤摘要】
【国外来华专利技术】声源分离装置和方法以及程序
本技术涉及声源分离装置、方法和程序,尤其涉及能够实现更高分离性能的声源分离装置、方法和程序。
技术介绍
传统上已知声源分离技术,其中从包括来自多个声源的声音的混合声音信号中提取目标声源的声音信号。作为这种声源分离技术,例如,提出了使用深度神经网络(DNN)的基于多通道维纳滤波器(MWF)的声源分离技术(参见例如非专利文献1)。在该声源分离技术中,通过DNN对混合声音信号进行振幅谱估计,以确定每个声源的振幅谱的估计值,并且通过最小均方误差方法从这些估计值和混合声音信号中确定目标声源的源信号。引文目录非专利文献非专利文献1:A.A.Nugraha、A.Liutkus和E.Vincent,"Multichannelmusicseparationwithdeepneuralnetworks."欧洲信号处理会议(EUSIPCO)。2016年。
技术实现思路
本专利技术要解决的问题然而,在上述技术中,难以以足够高的分离性能将目标声源的源信号与混合声音信号分离。例如,对于使用DNN的基于MWF的声源分离技术,随着DNN输出误差的降低,声源分离性能提高。然而,由于学习数据有限,并且由于问题复杂,DNN的学习通常是困难的,因此作为DNN的输出获得的振幅谱包括误差。这是分离性能恶化的原因之一。本技术是考虑到这种情况而设计的,并且能够实现更高的分离性能。问题的解决方案根据本技术的一个方面的声源分离装置包括组合单元,该组合单元将预定声源的第一声源分离信号与声源的第二声源分离信号组合,第一声源分离信号由第一声源分离系统从混合声音信号中分离出来,第二声源分离信 ...
【技术保护点】
1.一种声源分离装置,其包括:组合单元,其将预定声源的第一声源分离信号和所述声源的第二声源分离信号组合,所述第一声源分离信号通过第一声源分离系统从混合声音信号中分离出来,所述第二声源分离信号通过第二声源分离系统从所述混合声音信号中分离出来,在预定时间单位内,所述第二声源分离系统与所述第一声源分离系统的分离性能不同;并且输出通过所述组合获得的声源分离信号。
【技术特征摘要】
【国外来华专利技术】2016.09.09 JP 2016-176215;2017.04.14 JP 2017-080701.一种声源分离装置,其包括:组合单元,其将预定声源的第一声源分离信号和所述声源的第二声源分离信号组合,所述第一声源分离信号通过第一声源分离系统从混合声音信号中分离出来,所述第二声源分离信号通过第二声源分离系统从所述混合声音信号中分离出来,在预定时间单位内,所述第二声源分离系统与所述第一声源分离系统的分离性能不同;并且输出通过所述组合获得的声源分离信号。2.根据权利要求1所述的声源分离装置,其中所述组合单元基于组合参数线性组合所述第一声源分离信号和所述第二声源分离信号。3.根据权利要求2所述的声源分离装置,还包括:组合参数确定单元,其基于是相对于所述第一声源分离信号获得的声源信号的概率和是相对于所述第二声源分离信号获得的声源信号的概率来确定所述组合参数。4.根据权利要求1所述的声源分离装置,其中所述分离性能是SIR、SAR、SDR或ISR。5.根据权利要求1所述的声源分离装置,其中所述第一声源分离系统的分...
【专利技术属性】
技术研发人员:高桥直也,光藤祐基,斯特凡·乌利希,迈克尔·伊南科尔,托马斯·坎普,
申请(专利权)人:索尼公司,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。