信号增强装置、其方法、程序以及记录介质制造方法及图纸

技术编号:5029722 阅读:233 留言:0更新日期:2012-04-11 18:40
设定参数估计值的初始值,该参数估计值包括:混响参数估计值,包括用于计算在观测信号中包含的混响的估计值的线性卷积运算的回归系数;信号源参数的估计值,包括用于确定信号源的功率谱的线性预测系数和预测剩余功率的估计值;以及噪声参数估计值,包括噪声的功率谱的估计值。之后,直到满足规定的结束条件为止,交替地重复根据最似然估计来更新混响参数估计值和噪声参数估计值的至少一部分的处理和更新信号源参数估计值的处理。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及抑制观测信号中的加法性失真和乘法性失真,从而增强源信号的技 术。
技术介绍
已有对于在源信号中重叠了加法性失真和乘法性失真的观测信号,进行抑制加法 性失真和乘法性失真的处理,增强(emphasis)源信号的信号增强技术。首先,说明信号为 语音信号的情况下的一般的语音信号增强技术。此时,加法性失真对应于在室内存在的噪 声,乘法性失真对应于混响(reverberation)。图1是表示信号增强装置的一般结构的方框图。首先,从话筒等的传感器或语音文件等取得并进行了抽样和量化的时域的观测语 音的波形信号输入到频带分割单元。这些时域的观测信号在频带分割单元中,分割为每个 频带的窄带信号。即,时域的观测信号变换为时频域的观测信号。以下,将按每个频带分割 的观测信号的集合称为观测信号的复数谱图(spectrogram)。另外,频带分割单元通过短时 间傅里叶变换或多相滤波器组(filter bank)等的以往技术执行该处理。其中,也有不进 行该频带分割,而直接使用时域的观测信号进行源信号的增强处理的方法。此外,在说明书 中没有明确记载表现信号的区域的情况下,解释为是时频域。接着,在参数估计单元中,从观测信号的复数谱图中估计出将观测信号特征化的 某种参数。参数的例子有记述源信号或噪声的功率谱(spectre)的全极模型的参数,记述 室内传递系统的自回归模型的回归系数等。并且,在源信号估计单元中,使用观测信号的复数谱图和上述参数的估计值,计算 源信号的复数谱图的估计值。最后,在频带合成单元中,从源信号的复数谱图的估计值,合 成时域的源信号的估计值。另外,频带合成单元的处理对应于频带分割单元的处理。即,若 频带分割单元执行短时间傅里叶变换,则频带合成单元进行重叠(overlap)加法合成,若 频带分割单元执行多相滤波器组分析,则频带合成单元进行多相滤波器组合成。在省略了 频带分割单元的情况下,频带合成单元也被省略。以往的语音信号增强技术大致分为将除了源信号之外只存在噪声的环境作为对 象的技术(例如,参照非专利文献1)以及将除了源信号之外只存在混响的环境作为对象的 技术(例如,参照非专利文献2)。前者从除了源信号之外包括噪声的观测信号中抑制噪声。 后者从除了源信号之外包括混响的观测信号中抑制混响。以下,说明在非专利文献1、2中 分别提出的语音信号增强技术。另外,在以下的说明中,在文本中使用的符号“~”、“ ”等 应记载在字符的正上方,但由于文本记载的限制而记载在该字符的紧后面。<非专利文献1的噪声抑制技术>在非专利文献1中,提出了从在源信号加上噪声的观测信号中抑制噪声的噪声抑 制技术。以下,说明在非专利文献1中公开的各个处理单元的处理。非专利文献1的频带分割单元通过短时间傅里叶变换,将观测到的观测信号分割为每个频带的窄带信号。此外,非专利文献1的参数估计单元估计源信号的全极模型的信 号源参数3 和噪声模型的噪声参数(1 ,作为将观测信号即在源信号上重叠了噪声的信号 特征化的参数。在非专利文献1的例子中,首先,使用不存在源信号的时间区间的观测信号,算出 噪声参数的真值<^ (步骤S101)。接着,设定信号源参数估计值的初始值sΘ (步骤 S102)。此外,表示重复次数的索引i设定为0(步骤S103)。之后,使用信号源参数的估计值和噪声参数的真值d ,算出在提供了信 号源参数的估计值和噪声参数的真值 的组合和观测信号的复数谱图Y的情况 下的源信号的复数谱图S的附条件后验分布P (S I Y,s Θ ~α),d Θ )(步骤S104)。接着,使用 附条件后验分布ρ (S I Y,s Θ ~ω,d Θ ),将信号源参数的估计值s Θ ~ω更新为s Θ “(i+1)(步 骤S105)。然后,直到满足结束条件为止(步骤S106),一边将i每次增加1 (步骤S107),一 边重复步骤S104和S105的处理,并将在满足了规定的结束条件的时刻的信号源参数的估 计值s Θ α+1),作为信号源参数的最终估计值s Θ “而输出(步骤S108)。之后,源信号估计单元使用在参数估计单元中算出的参数(1 和s ~,并使用维 纳(Wiener)滤波器,求出源信号的复数谱图的估计值,频带合成单元通过重叠加法合成, 将该复数谱图的估计值变换为时域的源信号的估计值。<非专利文献2的混响抑制技术>在非专利文献2中,提出了从在源信号重叠了混响的观测信号中抑制混响的混响 抑制技术。以下,说明在非专利文献2中公开的各个处理单元的处理。在非专利文献2的混响抑制技术中,不进行频带分割处理。因此,非专利文献2的 参数估计单元和源信号估计单元直接对时域的观测信号进行处理。该参数估计单元估计信 号源参数和混响参数8θ,作为将观测信号即在源信号上重叠了混响的信号特征化的参 数。另外,非专利文献2的混响参数应用于在源信号中仅重叠了混响的时域的观测信号中, 是用于计算在观测信号中重叠的混响的线性滤波器的回归系数。在非专利文献2的例子中,首先,设定混响参数的估计值的初始值(步骤 Sill).此外,将表示重复次数的索引i设定为0(步骤S112)。之后,使用混响参数的估计值,将信号源参数的估计值更新为s ~(i+1)(步 骤Sl 13)。接着,使用被更新的信号源参数的估计值~(i+1),将混响参数的估计值更新为 g "(i+1)(步骤Sl 14)。然后,直到满足结束条件为止(步骤Sl 15),一边将i每次增加1 (步 骤S116),一边重复步骤S113和S114的处理,并将在满足了规定的结束条件的时刻的信号 源参数的估计值3 Θ (i+1),作为信号源参数的最终的估计值s Θ ~,并将最终的混响参数估 计值~α+1)作为最终的估计值g “而输出(步骤Sl 17)。之后,源信号估计单元将使用在参数估计单元中算出的混响参数的最终的估计值 而生成的线性滤波器卷积到观测信号中,计算并输出增强了源信号分量的语音信号。之后,源信号估计单元通过将使用在参数估计单元中算出的混响参数的最终的估计值8Θ “ 而生成的线性滤波器卷积到观测信号中,估计在观测信号中包含的混响,并从观测信号中 减去该混响,从而计算并输出抑制了混响的信号。# ^ M JC M 1 :Lim, J. S. and Oppenheim, Α. V. ,"All-pole modeling ofdegraded speech,,,IEEE Trans. Acoust. Speech, Signal Process. , Vol. 26, No. 3,pp.197-210(1978).2 =Yoshioka, Τ. ,Hikichi, Τ. and Miyoshi,Μ. ,"Dereverberationby Using Time-Variant Nature of Speech Production System, EURASIP J. Advances in Signal Process., Vol.2007, (2007), Article ID 65698,15pages, doi 10.1155/2007/65698.
技术实现思路
专利技术要解决的课题但是,至今不存在将噪本文档来自技高网
...

【技术保护点】
一种信号增强装置,包括:存储单元,存储从观测到的时域信号变换的时频域的观测信号;初始化单元,设定参数估计值的初始值,该参数估计值包括:混响参数估计值,包括用于计算在所述观测信号中包含的混响的估计值的线性卷积运算的回归系数;信号源参数估计值,包括用于确定源信号的功率谱的线性预测系数和预测剩余功率的估计值;以及噪声参数估计值,包括噪声的功率谱的估计值;第1更新单元,输入所述观测信号和所述参数估计值,且执行所述混响参数估计值和噪声参数估计值的至少一部分的更新处理或者所述信号源参数估计值的更新处理中的任一个处理,该更新处理是被执行以使得有关所述参数估计值的对数似然度函数的值增加的处理;第2更新单元,输入在所述第1更新部中获得的参数估计值的更新值的至少一部分,且执行所述混响参数估计值和噪声参数估计值的至少一部分的更新处理或者所述信号源参数估计值的更新处理中、在所述第1更新单元中没有执行的处理,该更新处理是被执行以使得有关所述参数估计值的更新值的对数似然度函数的值增加的处理;以及结束条件判定单元,判定是否满足结束条件,在没有满足所述结束条件的情况下,再次执行所述第1更新单元和所述第2更新单元的处理...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:吉冈拓也中谷智广三好正人
申请(专利权)人:日本电信电话株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1