目标音强调装置、噪音估计用参数学习装置、目标音强调方法、噪音估计用参数学习方法、程序制造方法及图纸

技术编号:21666044 阅读:51 留言:0更新日期:2019-07-20 07:38
本发明专利技术提供噪音估计用参数学习装置,即使在混响或时间帧差成为问题的大规模空间中,也可以使配置在远离的位置的多个麦克风协作而执行频谱相减法,强调目标音。学习多个麦克风的观测信号中包含的噪音的估计中使用的噪音估计用参数的噪音估计用参数学习装置包括:模型化单元,将规定的麦克风的观测信号的概率分布模型化,将时间帧差的概率分布模型化,将传递函数增益的概率分布模型化;似然函数设定单元,根据模型化的概率分布,设定与时间帧差有关的似然函数、与传递函数增益有关的似然函数;以及参数更新单元,交替地反复更新两个似然函数的变量,将收敛后的时间帧差以及传递函数增益作为噪音估计用参数输出。

Target tone emphasizing device, parameter learning device for noise estimation, target tone emphasizing method, parameter learning method and program for noise estimation

【技术实现步骤摘要】
【国外来华专利技术】目标音强调装置、噪音估计用参数学习装置、目标音强调方法、噪音估计用参数学习方法、程序
本专利技术涉及在大规模的空间中,使配置在远离的位置的多个麦克风协作来进行目标音的强调的技术、目标音强调装置、噪音估计用参数学习装置、目标音强调方法、噪音估计用参数学习方法、程序。
技术介绍
作为压制从某个方向到来的噪音的技术,代表性的有使用了麦克风阵列的波束成形。在广播用途的运动音的拾音中,大多取代使用波束成形而使用猎枪麦克风或抛物线麦克风等指向性麦克风。哪一种技术都强调从确定的方向到来的声音,压制从此以外的方向到来的声音。考虑在棒球场或足球场、制造工厂等大规模的空间中仅希望拾音目标音的状况。若举出具体例子,则有在棒球场时希望拾音击球音和裁判的声音,在制造工厂时希望拾音某个制造设备的运转声的情况等。在这样的环境下,有噪音从与目标音相同的方向到来的情况,在上述的技术中不能仅强调目标音。在压制从与目标音同方向到来的噪音的技术中,存在时间频率屏蔽。以下,使用算式说明这些方法。而且,在以下的算式中出现的表示观测信号的X和表示传递特性的H等右上方的数字意味着对应的麦克风的编号(索引)。例如在右上方的数字为(1)的情况下,对应的麦克风设为“第1麦克风”。而且,在以下的说明中出现的“第1麦克风”设为始终用于观测目标音的规定的麦克风。即,用“第1麦克风”观测的观测信号X(1)设为始终充分地包含了目标音的规定的观测信号,是适合作为音源强调中使用的信号的观测信号。另一方面,在以下的说明中也出现“第m麦克风”,但是在“第m麦克风”这样的情况下,意味着是与“第1麦克风”对比的“任意的麦克风”。因此,在“第1麦克风”或“第m麦克风”这样的情况下,其编号是概念性的,不通过该编号确定该麦克风的位置或性质。例如,若在棒球场的例子中进行说明,则在“第1麦克风”这样的情况下,不意味着例如该麦克风存在于“挡球网背面”等确定的位置。因为“第1麦克风”意味着是适于观测目标音的规定的麦克风,所以若目标音的位置移动则“第1麦克风”的位置随之移动(更正确地说,对麦克风分配的编号(索引)伴随目标音的移动而适当变更)。首先,将通过波束成形或指向性麦克风拾音的观测信号设为X(1)ω,τ∈CΩ×T。这里ω∈{1,...,Ω}和τ∈{1,...,T}分别为频率和时间的索引。在将目标音设为S(1)ω,τ∈CΩ×T,将不能完全压制的噪音群设为Nω,τ∈CΩ×T时,观测信号可以如以下那样记述。这里Hω(1)是从目标音位置至麦克风位置的传递特性。由式(1)可知,规定的(第1)麦克风的观测信号包含目标音和噪音。在时间频率屏蔽中,使用时间频率掩码(mask)Gω,τ来得到强调了目标音的信号Yω,τ。这里,理想的时间频率掩码Gω,τ^{ideal}通过以下的式子求出。但是,因为|Hω(1)S(1)ω,τ|或|Nω,τ|未知,所以需要使用观测信号和其它的信息进行估计。基于频谱相减法的时间频率屏蔽是在可以通过任何形式估计|N^ω,τ|时使用的方法。时间频率掩码使用估计出的|N^ω,τ|如以下那样来决定。在代表性的|N^ω,τ|的估计法中,由使用|X(1)ω,τ|的恒定分量的方法(非专利文献1)。但是对Nω,τ∈CΩ×T来说,在运动场中有打鼓的声音,在工厂中有打钉声音等,还包含非恒定的噪音,所以必须用其它方法估计|Nω,τ|。作为直观的|Nω,τ|的估计方法,有用麦克风直接观测噪音的方法。若为棒球场,则在外场看台安装麦克风对欢呼声|X(m)ω,τ|进行拾音,假定瞬时混合而如以下那样对其校正,若设为|N^ω,τ|则似乎可以解决。这里,Hω(m)是从第m麦克风至主麦克风的传递特性。现有技术文献非专利文献非专利文献1:S.Boll,“Suppressionofacousticnoiseinspeechusingspectralsubtraction,”IEEETrans.ASLP,1979.
技术实现思路
专利技术要解决的课题但是,在运动场那样大规模的空间中,为了使用被配置在足够远离的位置上的多个麦克风来去除噪音,存在以下的两个课题。<混响的问题>在抽样频率为48.0[kHz],短时傅里叶变换(STFT)的分析幅度为512点时,可作为瞬时混合记述的混响(脉冲应答)的时间长度为10[ms]。一般来说运动场或制造工厂的混响时间为其以上。因此不能假定单纯的瞬时混合模型。<时间帧差的问题>例如在棒球场中,从外场看台至本垒距离约100[m]。音速为C=340[m/s]时,外场看台的助威延迟约300[ms]到达。在抽样频率为48.0[kHz],STFT的偏移幅度为256点时,产生P≈60的时间帧差。因为该时间帧差,不能执行单纯的频谱相减法。因此,在本专利技术中,目的是提供在混响和时间帧差成问题的大规模空间中,也可以使配置在远离的位置上的多个麦克风协作而执行频谱相减法,强调目标音的噪音估计用参数学习装置。用于解决课题的手段本专利技术的噪音估计用参数学习装置是学习多个麦克风的观测信号中包含的噪音的估计中使用的噪音估计用参数的装置,包含模型化单元、似然函数设定单元、参数更新单元。模型化单元在多个麦克风中,将规定的麦克风的观测信号的概率分布模型化,将根据规定的麦克风和任意的麦克风和噪音源的相对位置差产生的时间帧差的概率分布模型化,将规定的麦克风和任意的麦克风和噪音源的相对位置差产生的传递函数增益的概率分布模型化。似然函数设定单元根据模型化后的概率分布,设定与时间帧差有关的似然函数、与传递函数增益有关的似然函数。参数更新单元将与时间帧差有关的似然函数的变量和与传递函数增益有关的似然函数的变量交替反复更新,输出收敛后的时间帧差以及传递函数增益作为噪音估计用参数。专利技术的效果按照本专利技术的噪音估计用参数学习装置,在混响和时间帧差成问题的大规模空间中,也可以使配置在远离的位置上的多个麦克风协作而执行频谱相减法,强调目标音。附图说明图1是表示实施例1的噪音估计用参数学习装置的结构的方框图。图2是表示实施例1的噪音估计用参数学习装置的操作的流程图。图3是表示实施例1的模型化单元的操作的流程图。图4是表示实施例1的似然函数设定单元的操作的流程图。图5是表示实施例1的参数更新单元的操作的流程图。图6是表示实施例2的目标音强调装置的结构的方框图。图7是表示实施例2的目标音强调装置的操作的流程图。图8是表示变形例2的目标音强调装置的结构的方框图。具体实施方式以下,详细地说明本专利技术的实施方式。而且,对具有相同的功能的结构部件附加相同的标号,省略重复说明。实施例1在实施例1中,解决上述两个问题。在实施例1中,为了使在大规模的空间中配置在远离的位置的麦克风协作而进行音源强调,提供估计时间帧差和混响的技术。具体地说,用统计模型记述时间帧差和混响(传递函数增益(注*1)),按照观测信号的似然最大化基准进行估计。而且,为了将因足够远离的距离而产生的、不能以瞬时混合记述的程度的混响模型化,通过音源的振幅频谱和传递函数增益的时频域中的卷积进行模型化。(注*1)混响在频域中可作为传递函数来记述,将其增益称为传递函数增益。以下,参照图1说明实施例1的噪音估计用参数学习装置。如图1所示,本实施例的噪音估计用参数学习装置1包括;模型化单元11、似然函数设定单元12和参数更本文档来自技高网
...

【技术保护点】
1.一种目标音强调装置,包括:观测信号取得单元,从多个麦克风得到观测信号;噪音估计单元,将从多个麦克风中规定的麦克风得到的观测信号、根据所述规定的麦克风、与所述多个麦克风中所述规定的麦克风不同的任意的麦克风和噪音源的相对位置差产生的时间帧差、根据所述规定的麦克风、任意的麦克风和所述噪音源的相对位置差产生的传递函数增益进行关联,估计在多个所述规定的麦克风的观测信号中包含的噪音;滤波器生成单元,至少根据所述估计的噪音,生成滤波器;以及滤波单元,通过所述滤波器将从所述规定的麦克风得到的观测信号滤波。

【技术特征摘要】
【国外来华专利技术】2016.12.16 JP 2016-2441691.一种目标音强调装置,包括:观测信号取得单元,从多个麦克风得到观测信号;噪音估计单元,将从多个麦克风中规定的麦克风得到的观测信号、根据所述规定的麦克风、与所述多个麦克风中所述规定的麦克风不同的任意的麦克风和噪音源的相对位置差产生的时间帧差、根据所述规定的麦克风、任意的麦克风和所述噪音源的相对位置差产生的传递函数增益进行关联,估计在多个所述规定的麦克风的观测信号中包含的噪音;滤波器生成单元,至少根据所述估计的噪音,生成滤波器;以及滤波单元,通过所述滤波器将从所述规定的麦克风得到的观测信号滤波。2.如权利要求1所述的目标音强调装置,所述规定的麦克风的观测信号包含目标音和噪音,所述任意的麦克风的观测信号包含噪音。3.如权利要求2所述的目标音强调装置,所述观测信号是将麦克风集音的音响信号变频后的信号,从所述噪音源至所述规定的麦克风的所述噪音的到达时间、从所述噪音源至所述任意的麦克风的所述噪音的到达时间的两个到达时间之差为所述变频的偏移幅度以上。4.如权利要求2或者3所述的目标音强调装置,所述噪音估计单元将所述规定的麦克风的观测信号的概率分布、将根据所述规定的麦克风、任意的麦克风和噪音源的相对位置差产生的时间帧差模型化后的概率分布、以及将根据所述规定的麦克风、所述任意的麦克风和所述噪音源的相对位置差产生的传递函数增益模型化后的概率分布进行关联,估计多个所述麦克风的观测信号中包含的噪音。5.如权利要求4所述的目标音强调装置,所述噪音估计单元将基于由所述规定的麦克风的观测信号的概率分布、将根据所述规定的麦克风、任意的麦克风和噪音源的相对位置差产生的时间帧差模型化后的概率分布、以及将根据所述规定的麦克风、所述任意的麦克风和所述噪音源的相对位置差产生的传递函数增益模型化后的概率分布所构成的三个所述概率分布而设定的两个似然函数进行关联,估计在多个所述麦克风的观测信号中包含的噪音,并且第1似然函数至少基于将所述时间帧差模型化后的概率分布,第2似然函数至少基于将所述传递函数增益模型化后的概率分布。6.如权利要求5所述的目标音强调装置,所述噪音估计单元交替地反复更新所述第1似然函数的变量和所述第2似然函数的变量。7.如权利要求6所述的目标音强调装置,所述第1似然函数的变量和所述第2似然函数的变量的更新,附带将所述传递函数增益限定为非负的值的限制而进行。8.如权利要求7所述的目标音强调装置,将所述时间帧差的所述概率分布以泊松分布进行模型化,将所述传递函数增益的所述概率分布以指数分布进行模型化。9.一种噪音估计用参数学习装置,学习在多个麦克风的观测信号中包含的噪音的估计中使用的噪音估计用参数,包括:模型化单元,将多个所述麦克风中规定的麦克风的观测信号的概率分布模...

【专利技术属性】
技术研发人员:小泉悠马齐藤翔一郎小林和则大室仲
申请(专利权)人:日本电信电话株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1