信号处理装置和方法以及程序制造方法及图纸

技术编号:39257275 阅读:12 留言:0更新日期:2023-10-30 12:08
本技术涉及信号处理装置和方法以及程序,其使得可以提高提取目标声音的准确度。该信号处理装置包括:参考信号生成单元,其基于混合声音的信号来生成与目标声音对应的参考信号,该混合声音的信号借助于布置在不同位置处的多个麦克风来收录并且其中目标声音和除了目标声音之外的声音被混合;以及声源提取单元,其从一帧或多帧的混合声音信号中提取与参考信号相似并目标声音被进一步强化的一帧的信号。本技术可以应用于信号处理装置。本技术可以应用于信号处理装置。本技术可以应用于信号处理装置。

【技术实现步骤摘要】
【国外来华专利技术】信号处理装置和方法以及程序


[0001]本技术涉及信号处理装置、信号处理方法和程序,具体地,涉及使得可以提高目标声音提取的精度的信号处理装置、信号处理方法和程序。

技术介绍

[0002]已经提出了从混合声音信号中提取期望提取的声音(在下文中,适当地称为目标声音)的技术,该混合声音信号是目标声音和期望去除的声音(在下文中,适当地称为干扰声音)的混合(例如,参见下面描述的专利文献1至专利文献3)。
[0003]引文列表
[0004]专利文献
[0005]专利文献1:日本专利特许公开第2006

72163号
[0006]专利文献2:日本专利第4449871号
[0007]专利文献3:日本专利特许公开第2014

219467号

技术实现思路

[0008]技术问题
[0009]在这样的领域中,期望提高目标声音提取的精度。
[0010]本技术是鉴于这样的情形而做出的,并且其目的是使得可以提高目标声音提取的精度。
[0011]问题的解决方案
[0012]根据本技术的第一方面的信号处理装置包括:参考信号生成部,其基于混合声音信号来生成与目标声音对应的参考信号,混合声音信号用布置在不同位置处的多个麦克风来收录,并且是目标声音和非目标声音的混合;以及声源提取部,其从一帧或多帧的混合声音信号中提取与参考信号相似并且目标声音被更加增强的一帧的信号。
[0013]根据本技术的第一方面的信号处理方法或程序包括以下步骤:基于混合声音信号来生成与目标声音对应的参考信号,混合声音信号用布置在不同位置处的多个麦克风来收录,并且是目标声音和非目标声音的混合;以及从一帧或多帧的混合声音信号中提取与参考信号相似并且目标声音被更加增强的一帧的信号。
[0014]在本技术的第一方面中,基于混合声音信号来生成与目标声音对应的参考信号,混合声音信号用布置在不同位置处的多个麦克风来收录,并且是目标声音和非目标声音的混合,以及从一帧或多帧的混合声音信号中提取与参考信号相似并且目标声音被更加增强的一帧的信号。
[0015]根据本技术的第二方面的信号处理装置包括:参考信号生成部,其基于混合声音信号来生成与目标声音对应的参考信号,混合声音信号用布置在不同位置处的多个麦克风来收录,并且是目标声音和非目标声音的混合;以及声源提取部,其从混合声音信号中提取与参考信号相似并且目标声音被更加增强的信号。在迭代地执行生成参考信号的处理和从
混合声音信号中提取信号的处理的情况下,参考信号生成部基于从混合声音信号中提取的信号来生成新的参考信号,并且声源提取部基于新的参考信号来从混合声音信号中提取信号。
[0016]根据本技术的第二方面的信号处理方法或程序包括以下处理:基于混合声音信号来生成与目标声音对应的参考信号,混合声音信号用布置在不同位置处的多个麦克风来收录,并且是目标声音和非目标声音的混合;以及从混合声音信号中提取与参考信号相似并且目标声音被更加增强的信号。在迭代地执行生成参考信号的处理和从混合声音信号中提取信号的处理的情况下,信号处理方法或程序包括以下步骤:基于从混合声音信号中提取的信号来生成新的参考信号,以及基于新的参考信号来从混合声音信号中提取信号。
[0017]在本技术的第二方面中,执行以下处理:基于混合声音信号来生成与目标声音对应的参考信号的处理,混合声音信号用布置在不同位置处的多个麦克风来收录,并且是目标声音和非目标声音的混合;以及从混合声音信号中提取与参考信号相似并且目标声音被更加增强的信号的处理。在迭代地执行生成参考信号的处理和从混合声音信号中提取信号的处理的情况下,基于从混合声音信号中提取的信号来生成新的参考信号,以及基于新的参考信号来从混合声音信号中提取信号。
[0018]根据本技术的第三方面的信号处理装置包括:参考信号生成部,其基于混合声音信号来生成与目标声音对应的参考信号,混合声音信号用布置在不同位置处的多个麦克风来收录,并且是目标声音和非目标声音的混合;以及声源提取部,其估计提取滤波器作为优化目标函数的解,目标函数包括:提取结果,其是与参考信号相似并且目标声音通过提取滤波器被更加增强的信号,以及声源模型的可调整参数,其表示提取结果与参考信号之间的相似性,目标函数反映提取结果与另一假想声源的分离结果之间的相似性和独立性,以及基于所估计的提取滤波器来从混合声音信号中提取信号。
[0019]根据本技术的第三方面的信号处理方法或程序包括以下步骤:基于混合声音信号来生成与目标声音对应的参考信号,混合声音信号用布置在不同位置处的多个麦克风来收录,并且是目标声音和非目标声音的混合;估计提取滤波器作为优化目标函数的解,目标函数包括:提取结果,其是与参考信号相似并且目标声音通过提取滤波器被更加增强的信号,以及声源模型的可调整参数,其表示提取结果与参考信号之间的相似性,目标函数反映提取结果与另一假想声源的分离结果之间的相似性和独立性,以及基于所估计的提取滤波器来从混合声音信号中提取信号。
[0020]在本技术的第三方面中,基于混合声音信号来生成与目标声音对应的参考信号,混合声音信号用布置在不同位置处的多个麦克风来收录,并且是目标声音和非目标声音的混合。提取滤波器被提取作为优化目标函数的解,目标函数包括:提取结果,其是与参考信号相似并且目标声音通过提取滤波器被更加增强的信号,以及声源模型的可调整参数,其表示提取结果与参考信号之间的相似性,目标函数反映提取结果与另一假想声源的分离结果之间的相似性和独立性。基于所估计的提取滤波器来从混合声音信号中提取信号。
附图说明
[0021][图1]是用于说明根据本公开内容的声源分离过程的示例的图。
[0022][图2]是用于说明基于缩减法并使用参考信号的声源提取方案的示例的图。
[0023][图3]是在说明在针对每个区生成参考信号之后执行声源提取的处理时要参考的图。
[0024][图4]是描绘根据一个实施方式的声源提取装置的配置示例的框图。
[0025][图5]是在说明区估计/参考信号生成处理的示例时要参考的图。
[0026][图6]是在说明区估计/参考信号生成处理的另一示例时要参考的图。
[0027][图7]是在说明区估计/参考信号生成处理的另一示例时要参考的图。
[0028][图8]是在说明根据实施方式的声源提取部的细节时要参考的图。
[0029][图9]是在说明在根据实施方式的声源提取装置处执行的处理的整体过程时要参考的流程图。
[0030][图10]是在说明在根据实施方式的STFT部处执行的处理时要参考的图。
[0031][图11]是在说明根据实施方式的声源提取处理的过程时要参考的流程图。
[0032][图12]是用于说明多抽头SIBF的图。
[0033][图13]是用于说明预处理的流程图。
[0034][图14]是用于说明移位和堆叠的图。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信号处理装置,包括:参考信号生成部,其基于混合声音信号来生成与目标声音对应的参考信号,所述混合声音信号用布置在不同位置处的多个麦克风来收录,并且是所述目标声音和非目标声音的混合;以及声源提取部,其从一帧或多帧的所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的一帧的信号。2.根据权利要求1所述的信号处理装置,其中,所述声源提取部从包括预定帧和所述预定帧之前的过去帧的多帧的混合声音信号中提取所述预定帧的信号。3.根据权利要求2所述的信号处理装置,其中,所述声源提取部从包括所述预定帧、所述过去帧和所述预定帧之后的未来帧的多帧的混合声音信号中提取所述预定帧的信号。4.根据权利要求1所述的信号处理装置,其中,所述声源提取部从相当于多个声道的一帧的混合声音信号中提取一帧的信号,所述一帧的混合声音信号通过在使所述多帧的混合声音信号在时间方向上移位的同时堆叠所述多帧的混合声音信号而获得。5.一种由信号处理装置执行的信号处理方法,所述信号处理方法包括:基于混合声音信号来生成与目标声音对应的参考信号,所述混合声音信号用布置在不同位置处的多个麦克风来收录,并且是所述目标声音和非目标声音的混合;以及从一帧或多帧的所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的一帧的信号。6.一种程序,其使计算机执行以下处理:基于混合声音信号来生成与目标声音对应的参考信号,所述混合声音信号用布置在不同位置处的多个麦克风来收录,并且是所述目标声音和非目标声音的混合;以及从一帧或多帧的所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的一帧的信号。7.一种信号处理装置,包括:参考信号生成部,其基于混合声音信号来生成与目标声音对应的参考信号,所述混合声音信号用布置在不同位置处的多个麦克风来收录,并且是所述目标声音和非目标声音的混合;以及声源提取部,其从所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的信号,其中,在迭代地执行生成所述参考信号的处理和从所述混合声音信号中提取所述信号的处理的情况下,所述参考信号生成部基于从所述混合声音信号中提取的信号来生成新的参考信号,并且所述声源提取部基于所述新的参考信号来从所述混合声音信号中提取所述信号。8.根据权利要求7所述的信号处理装置,其中,所述参考信号生成部通过将从所述混合声音信号中提取的信号输入至提取所述目标声音的神经网络来生成所述新的参考信号。9.根据权利要求7所述的信号处理装置,其中,所述声源提取部基于所述参考信号生成部第(n+1)次迭代时生成的参考信号的振幅和第n次迭代时从所述混合声音信号中提取的信号的相位来生成最终信号。
10.根据权利要求7所述的信号处理装置,其中,所述声源提取部从一帧或多帧的混合声音信号中提取一帧的信号。11.根据权利要求10所述的信号处理装置,其中,所述声源提取部从相当于多个声道的一帧的混合声音信号中提取一帧的信号,所述一帧的混合声音信号通过在使所述多帧的混合声音信号在时间方向上移位的同时堆叠所述多帧的混合声音信号而获得。12.一种由信号处理装置执行的信号处理方法,所述信号处理方法包括以下处理:基于混合声音信号来生成与目标声音对应的参考信号,所述混合声音信号用布置在不同位置处的多个麦克风来收录,并且是所述目标声音和非目标声音的混合;以及从所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的信号,在迭代地执行生成所述参考信号的处理和从所述混合声音信号中提取所述信号的处理的情况下,所述信号处理装置基于从所述混合声音信号中提取的信...

【专利技术属性】
技术研发人员:广江厚夫
申请(专利权)人:索尼集团公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1