当前位置: 首页 > 专利查询>微软公司专利>正文

采用增量贝叶斯学习进行噪声估计的方法技术

技术编号:3046636 阅读:172 留言:0更新日期:2012-04-11 18:40
一种采用增量贝叶斯学习来估计含噪声的信号中的附加噪声的方法和设备,其中,假定时变噪声先验分布,并采用前一时间步骤上计算所得的后验的近似来递归更新超参量(平均值和方差)。时域中的附加噪声在使用增量贝叶斯学习之前以对数谱或倒谱域来表示。使用每一独立帧的噪声的平均值和方差的估计结果来实现同一对数谱或倒谱域中的语音特性增强。

【技术实现步骤摘要】

本专利技术涉及噪声估计,尤其涉及模式识别中使用的信号的噪声估计。
技术介绍
模式识别系统,如语音识别系统,接收输入信号,并尝试对该信号进行解码,以找出该信号代表的模式。例如,在语音识别系统中,语音信号(经常被称作为测试信号)由识别系统接收,并对其进行解码,以识别该语音信号所代表的字串。通常输入信号被一些形式的噪声所破坏。为增强模式识别系统的性能,经常需要对有噪声的信号中的噪声进行估计。过去,曾经采用一些框架来进行信号中的噪声估计。在一种框架中,采用了分批算法,对输入信号的每一帧中的噪声进行估计,而独立于信号的其它帧中发现的噪声。然后对个别噪声估计统计平均值,来构成所有帧的统一噪声值。在第二种框架中,采用一种递归算法,根据一个或多个先前或后续帧的噪声估计,来估计当前帧的噪声。这类递归技术考虑到噪声随时间变化较小。在一种递归技术中,假定有噪声的信号是无噪声的信号和噪声信号的非线性函数。为便于计算,该非线性函数通常通过截断泰勒级数展开来近似,在某些展开点上进行计算。通常来说,泰勒级数展开在展开点上能提供对函数的最佳估计。因此,只有当展开点选取恰当时,泰勒级数近似才能表现良好。然而,在现有技术中,泰勒级数的展开点并不是在每一帧中进行优化。因此,采用递归算法进行的噪声估计并未达到理想的效果。最大似然(ML)和最大后验(MAP)技术用于非平稳噪声的时序点估计,该估计使用声学环境的迭代线性化非线性模型。一般来说,对噪声的分布使用简单的高斯模型,MAP估计提供了较高质量的噪声估计。然而,在MAP技术中,同高斯噪声先验相关联的平均值和方差自每一不含语音的测试话语的一个分段起为固定值。对于非平稳噪声来说,这一近似可能无法正确反应真实的噪声先验统计信息。根据以上情况,需要一种噪声估计技术,能够更有效地估计模式信号中的噪声。
技术实现思路
一种估计非平稳噪声的新方法采用了增量贝叶斯学习。在一方面,这一技术可以定义为假定一种时变噪声先验分布,其中使用在前一时间或帧步进计算所得的近似后验来对可由超参量(平均值和方差)定义的噪声估计进行递归更新。在另一方面,该技术可以定义为对于连续的每一帧,估计每一帧中的噪声,使得当前帧的噪声基于当前帧的数据似然性的高斯近似和先前帧序列中噪声的高斯近似。附图说明图1是一种可实践本专利技术的计算环境的结构图。图2是可实践本专利技术的替代计算环境的结构图。图3是在本专利技术的一个实施例中进行噪声估计的方法的流程图。图4是可使用本专利技术的模式识别系统的结构图。具体实施例方式图1描述了可实现本专利技术的合适的计算系统环境100的一个示例。该计算系统环境100只是合适的计算环境的一个示例,并非局限本专利技术的使用或功能范围。也不应认为计算环境100对示例操作环境100所描述的任一组件或其组合具有依赖性和需求。本专利技术在其它众多通用或专用计算系统环境或配置中都是可操作的。适合使用本专利技术的众所周知的计算系统、环境、和/或配置的示例包括但不限于,个人计算机、服务器计算机、手持式或膝上设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费类电子产品、网络PC、小型计算机、大型机、电话系统、包括以上任何系统或设备的分布式计算系统等等。在计算机可执行指令的通常环境下描述本专利技术,计算机可执行指令如程序模块,由计算机执行。程序模块通常包括例程、程序、对象、组件、数据结构等等,它们完成特定的任务或实现特定的抽象数据类型。程序和模块完成的任务在下文结合附图描述。本领域的技术人员可以将这里的描述和/或附图实现为计算机可执行指令,其可以配备在下文讨论的任意形式的计算机可读介质上。本专利技术也可以在分布式计算环境中实践,在该环境中,任务由通过通信网络连接的远端处理装置来完成。在分布式计算环境中,程序模块可以同时位于本地和远端计算机存储介质中,包括存储器装置。参考图1,实现本专利技术的一个示例系统包括以计算机110的形式表示的通用计算装置。计算机110的组件包括但不限于,处理单元120、系统存储器130以及将包括系统存储器在内的各种系统组件耦合至处理单元120的系统总线121。系统总线121可以是几种总线结构的任何一种,包括存储器总线或存储器控制器、外部总线,以及使用任意总线结构的本地总线。作为示例,但非局限,这类结构包括工业标准体系结构(ISA)总线、微通道结构(MCA)总线、扩展型ISA(EISA)总线、视频电子标准协会(VESA)本地总线、以及外围部件互联(PCI)总线,也称Mezzanine总线。计算机110通常包括各种计算机可读介质。计算机可读介质可以是任何可由计算机110存取的可用介质,包括易失性介质和非易失性介质,可移除介质和不可移除介质。作为示例,并非局限,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括在任意用于存储信息的方法或技术中实现的易失性介质和非易失性介质、可移除介质和不可移除介质,这些信息包括计算机可读指令、数据结构、程序模块或其它数据。计算机存储介质包括但不限于,RAM、ROM、EEPROM、按块擦除存储器或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储装置、或任何其它可以用于储存需要的信息并可由计算机110存取的介质。通信介质通常包括计算机可读指令、数据结构、程序模块或其它已调制数据信号如载波或其它传输机制中的数据,包括任何信息传送介质。术语“已调制数据信号”表示一种信号,该信号具有一个或多个通过对信号中的信息进行编码而设定或改变的特征。作为示例,并非局限,通信介质包括有线介质,如有线网络或直接连线连接,以及无线介质,如声学、RF、红外以及其它无线介质。上述介质的组合也应当包含在计算机可读介质的范围内。系统存储器130包括易失性和/或非易失性存储器形式的计算机存储介质,如只读存储器(ROM)131和随机存取存储器(RAM)132。基本输入/输出系统133(BIOS)通常储存在ROM 131中,包含协助在计算机110内如启动时在元件之间进行信息传输的基本例程。RAM 132通常包含处理单元120立即可存取和/或当前正操作的程序模块。作为示例,并非局限,图1描述了操作系统134、应用程序135、其它程序模块136以及程序数据137。计算机110也可包括其它可移除/不可移除的易失性/非易失性计算机存储介质。仅作示例,图1描述了硬盘驱动器141,对不可移除、非易失性磁介质进行读写;磁盘驱动器151,对可移除、非易失性磁盘152进行读写;以及光盘驱动器155,对可移除、非易失性光盘156如CD-ROM或其它光学介质进行读写。其它可在示例操作环境中使用的可移除/不可移除、易失性/非易失性计算机存储介质包括但不限于,磁带盒、闪存卡、数字多功能盘、数字视频磁带、固态RAM、固态ROM等等。硬盘驱动器141通常通过不可移除存储器接口,如接口140,连接至系统总线121。磁盘驱动器151和光盘驱动器155通常通过可移除存储器接口,如接口150,连接至系统总线121。以上讨论并在图1中描述的驱动器连同其相关的计算机存储介质为计算机110提供了计算机可读指令、数据结构、程序模块和其它数据的存储。例如,在图1中,描述硬盘驱动器141储存操作系统144、应用程序145、其它程序本文档来自技高网
...

【技术保护点】
一种估计含噪声信号中噪声的方法,该方法包括:将含噪声的信号划分为帧;以及采用增量贝叶斯学习来确定帧的噪声估计,包括平均值和方差,其中,假定时变噪声先验分布,并采用在前一帧中计算所得的后验噪声的近似来递归地更新噪声估计。

【技术特征摘要】
US 2003-3-31 10/403,6381.一种估计含噪声信号中噪声的方法,该方法包括将含噪声的信号划分为帧;以及采用增量贝叶斯学习来确定帧的噪声估计,包括平均值和方差,其中,假定时变噪声先验分布,并采用在前一帧中计算所得的后验噪声的近似来递归地更新噪声估计。2.如权利要求1所述的方法,其特征在于,所述确定噪声估计包括采用在前一帧中计算所得的后验噪声的近似来确定第一帧的噪声估计;确定含噪声信号的第二帧的数据似然性估计;以及使用第二帧的数据似然性估计和第一帧的噪声估计来确定第二帧的噪声估计。3.如权利要求2所述的方法,其特征在于,所述确定第二帧的数据似然性估计包括在等式中使用第二帧的数据似然性估计,该等式部分地基于将含噪声的信号定义为无噪声信号和噪声信号的非线性函数。4.如权利要求3所述的方法,其特征在于,所述等式更进一步基于所述非线性函数的近似。5.如权利要求2、3或4所述的方法,其特征在于,所述近似等于在部分由第一帧的噪声估计定义的点上的所述非线性函数。6.如权利要求5所述的方法,其特征在于,所述近似是泰勒级数展开。7.如权利要求6所述的方法,其特征在于,所述近似更进一步包括采用拉普拉斯近似。8.如权利要求2、3或4所述的方法,其特征在于,所述使用第二帧的数据似然性估计包括采用第一帧的噪声估计作为非线性函数的泰勒级数展开的一个展开点。9.如权利要求1、2、3或4所述...

【专利技术属性】
技术研发人员:A阿塞罗邓立JG德罗坡
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利