一种语音识别结果纠错方法技术

技术编号：3045274 阅读：241 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及语音识别技术领域，特别是一种语音识别结果纠错方法。利用可纠错知识库对识别结果进行纠错的方法，该方法的最基本的特征，一是以语料库中的连续语言片段作为纠错模版，利用语料库建立纠错模版库；二是对纠错模版库建立索引，使用检索技术对纠错模版进行快速查找；三是依据纠错模式，利用置信度将识别结果切分成短的识别片段，并将识别片段中的可信赖部分提交的纠错模版系统进行快速查找，得到与识别片段相关性高的纠错模版候选；四是利用声学混淆度矩阵从纠错模版候选中挑选与识别片段声学特征相近的模版进行替换纠错。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别
，特别是。
技术介绍
目前大部分语音识别系统采用N元文法(Ngram)语言模型，由于这种模型存在一种不完善的独立性假设，即假设当前词只依赖该词之前的N-1个词，其局限性表现在它只是前N-1个词的不确定性推理，导致识别结果往往出现毫无意义的句子或片段。
技术实现思路
本专利技术提出了，能够利用可变长纠错模版，根据置信度和声学混淆度对识别结果进行纠错。本专利技术可用于大词汇量连续语音识别系统。本专利技术主要有如下特征一是以语料库中的连续语言片段作为纠错模版，利用语料库建立纠错模版库；二是对纠错模版库建立索引，使用快速搜索技术对纠错模版库进行快速查找；三是依据纠错模式，利用置信度将识别结果切分成短的识别片段，并将识别片段中的可信赖部分提交的纠错模版系统进行快速查找，得到与识别片段相关性高的纠错模版候选；四是利用声学混淆度矩阵从纠错模版候选中挑选与识别片段声学特征相近的模版进行替换纠错。技术方案，包括以下步骤1)识别系统对输入语音进行识别运算和置信度计算，得到带有置信度的识别结果； 2)依据纠错模式，按照置信度的高低将识别结果切分成小的识别片段；3)将所得到的识别片段输入到纠错模版检索系统，得到与识别片段相关性高的纠错模版候选列表；4)计算识别片段与候选列表中纠错模版的声学混淆度，挑选其中声学相似度最高的模版，当识别片断与该纠错模版的相似程度大于一个可信赖的门限时，使用纠错模版代替该识别结果片段；5)将纠错后的片段合并，得到纠错后的识别结果。所述的语音识别结果纠错方法，还包括，在对输入语音进行识别运算的同时进行置信度计算，得到带有置...

【技术保护点】
一种语音识别结果纠错方法，包括以下步骤：　　　　１）识别系统对输入语音进行识别运算和置信度计算，得到带有置信度的识别结果；　　　　２）依据纠错模式，按照置信度的高低将识别结果切分成小的识别片段；　　　　３）将所得到的识别片段输入到纠错模版检索系统，得到与识别片段相关性高的纠错模版候选列表；　　　　４）计算识别片段与候选列表中纠错模版的声学混淆度，挑选其中声学相似度最高的模版，当识别片断与该纠错模版的相似程度大于一个可信赖的门限时，使用纠错模版代替该识别结果片段；　　　　５）将纠错后的片段合并，得到纠错后的识别结果。

【技术特征摘要】
1.一种语音识别结果纠错方法，包括以下步骤1)识别系统对输入语音进行识别运算和置信度计算，得到带有置信度的识别结果；2)依据纠错模式，按照置信度的高低将识别结果切分成小的识别片段；3)将所得到的识别片段输入到纠错模版检索系统，得到与识别片段相关性高的纠错模版候选列表；4)计算识别片段与候选列表中纠错模版的声学混淆度，挑选其中声学相似度最高的模版，当识别片断与该纠错模版的相似程度大于一个可信赖的门限时，使用纠错模版代替该识别结果片段；5)将纠错后的片段合并，得到纠错后的识别结果。2.根据权利要求1所述的语音识别结果纠错方法，其特征在于，还包括，在对输入语音进行识别运算的同时进行置信度计算，得到带有置信度的识别结果的步骤。3.根据权利要求1所述的一种语音识别结果纠错方法，其特征在于，还包括，根据置信的高低将识别结果切分成小的识别片段时，首先设置置信度门限CM-threshold和系统纠错模板最长字数max-var-length，置信度高于CM-threshold时认为识别结果是可信赖的，切分后的识别片段中可信赖的字数不得大于max-var-length。4.根据权利要求1或3所述的语音识别结果纠错方法，其特征在于，还包括，将识别结果分块，连续的置信度高于或低于CM-threshold的字划为一个模块的步骤，即将识别结果划为一个或多个(A，x，B)模式构成，其中A、B为置信度高于CM-threshold的模块，x为置信度低于CM-threshold的模块，A和B最多一个为空模块。5.根据权利要求1或3或4所述的语音识别结果纠错方法，其特征在于，还包括，对于识别结果中所有的低置信度模块x，若A的长度大于或等于max-var-length，则将A中与x相邻的长为max-var-length的部分，设为sub-A，与x组成片段(sub-A，x)，sub-A用来搜索纠错模版库，sub-A的长度不固定的步骤。6.根据权利要求1或3或4所述的语音识别结果纠错方法，其特征在于，还包括，对于识别结果中所有的低置信度模块x，若A长度小于max-var-length，则将B中与x相邻的部分sub-B，与A、x组成片段(A，x，sub-B)，A和sub-B用来搜索纠错模版库的步骤，A和sub-B最多一个可以为空模块，其中A和sub-B的长度和不得大于max-var-length，A和sub-B的长度不固定。7.根据权利要求1或5或6所述的语音识别结果纠错方法，其特征在于，还包括，将识别结果切分成片段后，将每个片段的可信赖部分在纠错模版库中进行快速查找，得到一个或多个与识别片段相关性高的纠错模版的步骤。8.根据权利要求1或7所述的语音识别结果纠错方法，其特征在于，还包括，纠错模版检索系统包括两个部分，第一部分是纠错模版索引的建立，第二部分是纠错模版的搜索。9.根据权利要求1或8所述的语音识别结果纠错方法，其特征在于，还包括，其中第一部分的基本原理是，把语料库中所有连续的字数在6到12之间的语言片段作为纠错模版，首先从语料库中提取出所有的纠错模版，然后采用倒置文件作为索引结构对纠错模版库建立索引，为了减小倒置文件的大小，需要对倒置文件压缩。10.根据权利要求1或8所述的语音识别结果纠错方法，其特征在于，还包括，其中第二部分的基本原理是，查询时首先将可信赖部分转换为布尔查询，在索引库中进行快速搜索，...

【专利技术属性】
技术研发人员：王晓瑞，江杰，王士进，丁鹏，徐波，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人