使用码本进行频谱图重建制造技术

技术编号:3046147 阅读:166 留言:0更新日期:2012-04-11 18:40
一种重建包括频谱图数据的被干扰频谱图的方法,该频谱图数据经受可靠性测量的判定,并且其中具有低可靠性测量的频谱图数据被更可靠数据替换,其特征在于该替换是通过使用具有更高可靠性测量的频谱图数据作为用来选择在其中存储了所述更可靠数据的码本条目的装置来执行的。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种重建被干扰频谱图的方法,该被干扰频谱图包括经受可靠性测量判定的频谱图数据,并且其中具有低可靠性测量的频谱图数据被更加可靠的数据替换。本专利技术还涉及一种实现上述方法的设备,该设备包括使频谱图数据经受可靠性测量判定的装置,和用更可靠数据替换具具有低可靠性测量的频谱图数据的装置;本专利技术还涉及适于在有关设备中使用的方法的信号。该方法可以从以下文章获得题目为“Introduction of a Reliability Measure inMissing Data Approach for Robust Speech Recognition”,作者是Ph.Renevey和A.Drygajlo,出版在Proceedings of the 10th European Signal Processing Conference(EUSIPCO 2000),Tampere,Finland.Sept.5-8,2000,pp 473476。该已知方法建议了对于语音频谱图中噪声的被干扰数据在0到1范围内的随机可靠性测量的判定。信噪比提供了关于噪声和信号的相对重要性的信息,并适用于检测可靠的和非可靠的数据频谱图区域。基于时间独立的高斯混合模型,非可靠的频谱图数据被非可靠数据的估计值替换。已知方法的缺点在于关于高斯混合模型的计算提供有限的精确度,原因在于诸如语音频谱图并不总是按照高斯模型运行。因此本专利技术的目的在于提供一种更低成本的、更容易实现并且更精确的方法和设备,来改善被干扰频谱图的重建,而不使用高斯模型。此外根据本专利技术的方法的特征在于使用具有更高可靠性测量的频谱图数据作为选择存储了更可靠数据的码本条目的装置来进行替换的。同样地,根据本专利技术的设备的特征在于该设备还包括连接到判定装置和替换装置的码本装置,该替换装置使用具有更高可靠性测量的频谱图数据作为选择存储了更可靠数据的码本条目的装置来进行替换的。根据本专利技术的方法和设备其优点在于码本起易于实现的查找表的作用。在实际重建之前,码本填充了存储普通更可靠数据的条目,该数据形成了关于被干扰数据的先验信息。具有更高可靠性测量的频谱图数据用来选择具有可靠先验信息的条目,从而用存储在码本中的更可靠数据替换具有低可靠性测量的频谱图数据。根据本专利技术的方法和设备的另一个优点就是避免了校正计算、矩阵倒置和对所使用统计模型的特定类型的限制。根据本专利技术的方法的一个实施例其特征在于码本条目的选择是基于具有更高可靠性测量的频谱图数据H和存储在码本中的可靠的频谱图数据H′之间的匹配。这种情况下,码本可以包括可靠的频谱图数据H′和可靠的频谱图数据M。如果存储在码本中的数据H′非常匹配于具有更高可靠性测量的频谱图数据H,那么使用数据M来代替具有低可靠性测量的频谱图数据L。那么最后的结果就是更高可靠数据H或可能是H′和改进的更高可靠数据M,该最后结果可以用于大部分语音的重建。根据本专利技术的方法的又一个实施例其特征在于替换是逐渐的替换。该逐渐的替换以一种灵活的加权方法将频谱图数据(L)和更可靠数据(M)相结合。该结合的结果然后由有关算法输出。根据本专利技术的方法的进一步实施例,其特征在于逐渐替换依赖于可靠性测量。在这种情况下,数据(L)和(M)的结合是根据可靠性测量而被加权的。根据本专利技术的方法的进一步实施例,其中存储在码本中的频谱图数据包括从训练获得的数据(H′,M)。利用先验训练对话填充码本是非常容易实现的,并产生未失真的“干净的”码本数据。根据本专利技术的方法的另一个进一步实施例其特征在于被干扰声频图是被噪声干扰的,尤其是被诸如背景噪声和/或声音回声的附加噪声。上述方法的优点可以用在诸如在车内的噪声环境中。根据本专利技术的方法的进一步实施例其特征在于最后输出可靠数据受关于它的已知时间和/或频率状态的信息影响。该已知信息通常是先验信息或是从基于实时而获得的信息。该信息提供了附加的灵活性并促进了诸如语音频谱图的逼真的重建。根据本专利技术的方法的进一步实施例其特征在于被干扰频谱图是频谱减法处理的结果,在该减法处理中从原始干扰信号中减去估计的或测量的干扰。通过包括频谱减法并应用该频谱减法,从而在使频谱图数据经受可靠性测量的判定和执行替换之前改善被干扰频谱图数据中的干扰的数量;,能进一步改善重建。现在将进一步结合它们附加的优点阐述本专利技术的方法和设备,同时参考附图,在附图中,相似的元件以相同的附图标记来表示。在这些图中附图说明图1显示了设备中执行根据本专利技术的重建被干扰频谱图的方法的步骤的概略图;图2显示了解释根据本专利技术的方法和设备的基本操作的简单示意图;图3显示了表示具有非可靠数据的非可靠区域的可能的频率—时间图,该非可靠数据可以从产生于可靠区域的数据中估计得到,从而达到频谱图重建的目的。图1显示了在设备D中进行的关于被干扰数据重建的方法的功能步骤的概略图,该被干扰数据诸如频谱图中的被干扰数据。这样的重建在诸如语音或声音控制应用的语音或声音识别系统中是重要的。该干扰可以是例如噪声的形式,尤其是诸如在车内中会产生的附加噪声。另一种干扰的例子是回声,尤其是声音回声。在图1的设备D中示出的被干扰并通常被开窗口的输入信号在输入端1处通过诸如离散傅立叶变换(DFT)滤波器组2进行谱域分析,之后可以忽略在其输出端3的输出信号的相位以显示绝对值单元5的输出端4处的诸如能量谱、平方振幅谱等等。许多情况下感兴趣的只是频率谱的振幅。至于依照时间的频率振幅谱将在下文中被称作频谱图。对于许多声音重建或者声音识别系统来说,在DFT之后使用MEL比例滤波器组6以获得具有频率间隔的频域输出,该频率间隔在MEL比例上是线性的,从而减少频率分解。如果使用没有滤波器组6的设备D,那么设备D可以被应用在与语音识别器独立的语音增强中。然而,在这种情况下要处理大量频率数据。如果在输入端1的输入信号被干扰,那么频谱图S中的数据将也将被干扰。然而在频谱图中的一些数据区域将比其他数据更加失真和被干扰。该重建方法使用更可靠的数据替换了更易被干扰及由此更低可靠的频谱图数据。可以从码本7中得到这样的更可靠数据。这样的码本可以用原有的已知方法用语音数据填充。一种获取典型语音矢量的技术在以下文章中公开题目是An Algorithm for Vector Quantizer Design,作者是Y.Linde、A.Buzo和R.M.Gray,出版在IEEE Transactions on Communications,vol.28.No.1,pp84-95,Jan.1980。码本7包括从训练获得的数据,通常是被轻微干扰或可能没有被干扰的,也就是“干净的”数据。在允许装置8对输入到装置8的频谱图数据进行可靠性测量的判定之后,另一装置9将具有低可靠性测量的频谱图数据L替换成从码本7选出的更可靠数据M。执行该选择以便使具有更高可靠性测量的频谱图数据H用作选择在其中存储了所述更加可靠数据M的码本7中的条目的装置或者指示器。在频谱图中的一个低可靠数据部分或多个数据部分L就以这样的方法被更可靠数据部分M替换掉了,该更可靠数据部分M从码本7中的训练数据中得到的先验知识中获得。该方法避免了校正计算、矩阵倒置和关于统计模型尤其是高斯模型的特定类型的限制。任何合适的方法能够通过可靠性判定本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种重建包括频谱图数据的被干扰频谱图的方法,该频谱图数据经受可靠性测量的判定,并且其中具有低可靠性测量的频谱图数据被更可靠数据替换,其特征在于该替换是通过使用具有更高可靠性测量的频谱图数据作为用来选择在其中存储了所述更可靠数据的码本条目的装置来执行的。2.如权利要求1所述的方法,其特征在于码本条目的选择是基于具有更高可靠性测量的频谱图数据和存储在码本中的可靠频谱图数据之间的匹配。3.如权利要求1或2所述的方法,其特征在于替换是逐渐的替换。4.如权利要求3所述的方法,其特征在于逐渐的替换依赖于可靠性测量。5.如权利要求1-4之一所述的方法,其特征在于存储在码本中的频谱图数据包括从训练中得到的数据。6.如权利要求1-5之一所述的方法,其特征在于被干扰频谱图是被噪声干扰,尤其是...

【专利技术属性】
技术研发人员:M·兰C·P·詹塞
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1