信号处理装置和方法以及程序制造方法及图纸

技术编号：39257275 阅读：12 留言：0更新日期：2023-10-30 12:08

本技术涉及信号处理装置和方法以及程序，其使得可以提高提取目标声音的准确度。该信号处理装置包括：参考信号生成单元，其基于混合声音的信号来生成与目标声音对应的参考信号，该混合声音的信号借助于布置在不同位置处的多个麦克风来收录并且其中目标声音和除了目标声音之外的声音被混合；以及声源提取单元，其从一帧或多帧的混合声音信号中提取与参考信号相似并目标声音被进一步强化的一帧的信号。本技术可以应用于信号处理装置。本技术可以应用于信号处理装置。本技术可以应用于信号处理装置。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】信号处理装置和方法以及程序

[0001]本技术涉及信号处理装置、信号处理方法和程序，具体地，涉及使得可以提高目标声音提取的精度的信号处理装置、信号处理方法和程序。

技术介绍

[0002]已经提出了从混合声音信号中提取期望提取的声音(在下文中，适当地称为目标声音)的技术，该混合声音信号是目标声音和期望去除的声音(在下文中，适当地称为干扰声音)的混合(例如，参见下面描述的专利文献1至专利文献3)。
[0003]引文列表
[0004]专利文献
[0005]专利文献1：日本专利特许公开第2006
‑
72163号
[0006]专利文献2：日本专利第4449871号
[0007]专利文献3：日本专利特许公开第2014
‑
219467号

技术实现思路

[0008]技术问题
[0009]在这样的领域中，期望提高目标声音提取的精度。
[0010]本技术是鉴于这样的情形而做出的，并且其目的是使得可以提高目标声音提取的精度。
[0011]问题的解决方案
[0012]根据本技术的第一方面的信号处理装置包括：参考信号生成部，其基于混合声音信号来生成与目标声音对应的参考信号，混合声音信号用布置在不同位置处的多个麦克风来收录，并且是目标声音和非目标声音的混合；以及声源提取部，其从一帧或多帧的混合声音信号中提取与参考信号相似并且目标声音被更加增强的一帧的信号。
[0013]根据本技术的第一方面的信号处理方法或程序包括以...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信号处理装置，包括：参考信号生成部，其基于混合声音信号来生成与目标声音对应的参考信号，所述混合声音信号用布置在不同位置处的多个麦克风来收录，并且是所述目标声音和非目标声音的混合；以及声源提取部，其从一帧或多帧的所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的一帧的信号。2.根据权利要求1所述的信号处理装置，其中，所述声源提取部从包括预定帧和所述预定帧之前的过去帧的多帧的混合声音信号中提取所述预定帧的信号。3.根据权利要求2所述的信号处理装置，其中，所述声源提取部从包括所述预定帧、所述过去帧和所述预定帧之后的未来帧的多帧的混合声音信号中提取所述预定帧的信号。4.根据权利要求1所述的信号处理装置，其中，所述声源提取部从相当于多个声道的一帧的混合声音信号中提取一帧的信号，所述一帧的混合声音信号通过在使所述多帧的混合声音信号在时间方向上移位的同时堆叠所述多帧的混合声音信号而获得。5.一种由信号处理装置执行的信号处理方法，所述信号处理方法包括：基于混合声音信号来生成与目标声音对应的参考信号，所述混合声音信号用布置在不同位置处的多个麦克风来收录，并且是所述目标声音和非目标声音的混合；以及从一帧或多帧的所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的一帧的信号。6.一种程序，其使计算机执行以下处理：基于混合声音信号来生成与目标声音对应的参考信号，所述混合声音信号用布置在不同位置处的多个麦克风来收录，并且是所述目标声音和非目标声音的混合；以及从一帧或多帧的所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的一帧的信号。7.一种信号处理装置，包括：参考信号生成部，其基于混合声音信号来生成与目标声音对应的参考信号，所述混合声音信号用布置在不同位置处的多个麦克风来收录，并且是所述目标声音和非目标声音的混合；以及声源提取部，其从所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的信号，其中，在迭代地执行生成所述参考信号的处理和从所述混合声音信号中提取所述信号的处理的情况下，所述参考信号生成部基于从所述混合声音信号中提取的信号来生成新的参考信号，并且所述声源提取部基于所述新的参考信号来从所述混合声音信号中提取所述信号。8.根据权利要求7所述的信号处理装置，其中，所述参考信号生成部通过将从所述混合声音信号中提取的信号输入至提取所述目标声音的神经网络来生成所述新的参考信号。9.根据权利要求7所述的信号处理装置，其中，所述声源提取部基于所述参考信号生成部第(n+1)次迭代时生成的参考信号的振幅和第n次迭代时从所述混合声音信号中提取的信号的相位来生成最终信号。
10.根据权利要求7所述的信号处理装置，其中，所述声源提取部从一帧或多帧的混合声音信号中提取一帧的信号。11.根据权利要求10所述的信号处理装置，其中，所述声源提取部从相当于多个声道的一帧的混合声音信号中提取一帧的信号，所述一帧的混合声音信号通过在使所述多帧的混合声音信号在时间方向上移位的同时堆叠所述多帧的混合声音信号而获得。12.一种由信号处理装置执行的信号处理方法，所述信号处理方法包括以下处理：基于混合声音信号来生成与目标声音对应的参考信号，所述混合声音信号用布置在不同位置处的多个麦克风来收录，并且是所述目标声音和非目标声音的混合；以及从所述混合声音信号中提取与所述参考信号相似并且所述目标声音被更加增强的信号，在迭代地执行生成所述参考信号的处理和从所述混合声音信号中提取所述信号的处理的情况下，所述信号处理装置基于从所述混合声音信号中提取的信...

【专利技术属性】
技术研发人员：广江厚夫，
申请(专利权)人：索尼集团公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人