利用具有转换状态空间模型的变化推理的语音识别方法技术

技术编号：3046638 阅读：268 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了开发出的一种方法，其包括１）定义对于连续有价值的隐藏相关生成式参数和观测语音音质的转换状态空间模型，以及２）根据观测的输入值序列，近似提供隐藏相关生成式参数的序列和语音单元序列的似然性的后验概率。在近似后验概率中，语音单元的边界是不固定的，但是是可以被最优确定的。在一个实施例中，使用了高斯近似混合。在另一个实施例中，使用了ＨＭＭ后验概率。（*该技术在2024年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

技术介绍
本专利技术涉及模式识别，尤其涉及语音识别。模式识别系统，例如语音识别系统，接收输入信号并且将信号解码以发现信号所代表的模式。例如在语音识别系统中，语音信号(经常称为测试信号)通过识别系统接收并且将其解码以识别由语音信号代表的字符串。很多语音识别系统利用隐藏马尔可夫模型，在该隐藏马尔可夫模型中，也可以称为声学单元或者语言单元的语音单元是通过单层连接的状态表示的。利用训练信号，来确定每个语音单元的占用状态和在状态之间跃迁的概率分布。为了对语音信号解码，将信号分成帧，并且将每帧变换成特征向量。然后将特征向量比作状态的分布以识别通过帧表示的HMM状态的大部分可能序列。然后选择与那个序列对应的语音单元。虽然基于HMM的识别系统在执行很多相对简单的语音识别任务时非常好，但是它们不能直接做语音的一些重要的动态元素的模型(并且众所周知很难执行象对话式语音一样的困难的任务)。因此，它们不能适应用于训练的语音信号和已经解码的语音信号之间的动态发音的差别。例如，在临时的说话的调整中，说话者趋向于次清晰发音或者趋向于比他们的语音的清晰发音差。这就意味着在重新定向到下一个目标之前，...

【技术保护点】
一种估计转换状态空间模型的后验概率的方法，该后验概率根据与帧序列联系在一起的输入值提供语音单元组和帧序列的隐藏参数组的似然性，其特征在于，所述方法包括：通过将单个隐藏参数概率乘到一起形成隐藏参数概率的乘积的方法部分地近似后验概率，其中每个单个隐藏参数概率，在给定帧的语音单元和给定适于帧序列的输入值的帧时，提供隐藏参数的概率；并且调整定义隐藏参数概率的参数，使隐藏参数概率提供后验概率的较好的近似。

【技术特征摘要】
US 2003-4-1 10/405,1661.一种估计转换状态空间模型的后验概率的方法，该后验概率根据与帧序列联系在一起的输入值提供语音单元组和帧序列的隐藏参数组的似然性，其特征在于，所述方法包括通过将单个隐藏参数概率乘到一起形成隐藏参数概率的乘积的方法部分地近似后验概率，其中每个单个隐藏参数概率，在给定帧的语音单元和给定适于帧序列的输入值的帧时，提供隐藏参数的概率；并且调整定义隐藏参数概率的参数，使隐藏参数概率提供后验概率的较好的近似。2.如权利要求1所述的方法，其特征在于，所述近似后验概率进一步包括用语音单元概率的乘积乘以隐藏参数概率的乘积，其中每个语音单元概率为一帧提供语音单元的概率。3.如权利要求2所述的方法，其特征在于，所述方法进一步包括调整语音单元概率，使语音单元概率提供较好的后验概率的近似。4.如权利要求2所述的方法，其特征在于，所述方法进一步包括利用后验概率的近似解码输入值，以识别帧序列的语音单元序列。5.如权利要求4所述的方法，其特征在于，所述利用的近似包括为每一帧选择语音单元是选择该帧的具有最高语音单元概率的语音单元。6.如权利要求4所述的方法，其特征在于，所述利用的近似包括将持续时间约束应用到语音单元中，并且根据持续时间约束和语音单元概率选择最好的语音单元序列。7.如权利要求1所述的方法，其特征在于，所述近似后验概率进一步包括用语音单元跃迁概率的乘积乘以隐藏参数概率的乘积，其中每个语音单元跃迁概率在给定另一帧中语音单元时，提供一帧中的语音单元的概率。8.如权利要求7所述的方法，其特征在于，所述方法进一步包括调整语音单元跃迁概率，使语音单元跃迁概率提供后验概率的较好的近似。9.如权利要求7所述的方法，其特征在于，所述方法进一步包括利用后验概率的近似解码输入值，以识别帧序列的语音单元序列。10.如权利要求9所述的方法，其特征在于，所述利用的近似包括根据语音单元跃迁概率选择语音单元序列。11.如权利要求10所述的方法，其特征在于，所述利用的近似包括将持续时间约束应用到语音单元，并且根据持续时间约束和语音单元跃迁概率选择最好的语音单元序列。12.如权利要求1所述的方法，其特征在于，所述调整定义隐藏参数概率的参数包括根据转换状态空间模型参数调整参数以产生已调整的参数。13.如权利要求12所述的方法，其特征在于，所述输入值从训练信号中产生，并且其中调整参数进一步包括根据定义隐藏参数概率的已经调整的参数调整转换状态空间模型的参数，以形成已经调整的转换状...

【专利技术属性】
技术研发人员：H埃笛亚斯，LJ李，邓立，
申请(专利权)人：微软公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人