一种确定语音识别结果置信度的方法和装置制造方法及图纸

技术编号:10075926 阅读:143 留言:1更新日期:2014-05-24 07:07
本发明专利技术提供了一种确定语音识别结果置信度的方法和装置,其中方法包括:确定解码得到的词图中每条弧的置信度,并确定词图中的最优路径;对所述最优路径上的每条弧Ai,在词图中确定与该弧Ai存在竞争关系的弧集合T;在确定所述弧Ai表示的词语的置信度时,从与所述Ai存在竞争关系的弧集合T中确定出弧Aj,其中弧Aj与弧Ai表示相同的词语,或者弧Aj与其所连接弧组合构成与弧Ai表示相同的词语;结合弧Ai和弧Aj的置信度,或进一步结合所述弧Aj所连接弧的置信度确定弧Ai表示的词语的置信度。本发明专利技术在确定语音识别结果的置信度时,考虑了复合词的构成因素,使得置信度更加准确地反映真实状况。

【技术实现步骤摘要】

本专利技术涉及计算机应用技术中的语音识别领域,特别涉及一种确定语音识别结果置信度的方法和装置
技术介绍
在语音识别中置信度用来表示识别结果为正确结果的可能性,值越大表示识别结果是正确结果的可能性越高,是进行语音识别的重要依据,语音识别结果置信度的确定方法直接影响了语音识别的准确性。语音识别结果的置信度确定主要是通过对解码生成的词图(Aattice)进行处理得到的。词图是近年来较常用的一种语音识别结果表现形式,它将解码的多个候选结果在一个有向无环图上表示,在保留多候选信息的同时节约了存储空间。在词图中弧表示词,以结点表示词的连接关系,而每个词都属于一个从开始结点到结束结点的路径。其中词图中的每条弧可由一个五元组表示{W,Aw,Lw,Sw,Ew
一种确定语音识别结果置信度的方法和装置

【技术保护点】
一种确定语音识别结果置信度的方法,其特征在于,该方法包括:S1、确定解码得到的词图中每条弧的置信度,并确定词图中的最优路径;S2、对所述最优路径上的每条弧Ai,在词图中确定与该弧Ai存在竞争关系的弧集合T;S3、在确定所述弧Ai表示的词语的置信度时,从与所述Ai存在竞争关系的弧集合T中确定出弧Aj,其中弧Aj与弧Ai表示相同的词语,或者弧Aj与其所连接弧组合构成与弧Ai表示相同的词语;结合弧Ai和弧Aj的置信度,或进一步结合所述弧Aj所连接弧的置信度确定弧Ai表示的词语的置信度。

【技术特征摘要】
1.一种确定语音识别结果置信度的方法,其特征在于,该方法包括:
S1、确定解码得到的词图中每条弧的置信度,并确定词图中的最优路径;
S2、对所述最优路径上的每条弧Ai,在词图中确定与该弧Ai存在竞争关系
的弧集合T;
S3、在确定所述弧Ai表示的词语的置信度时,从与所述Ai存在竞争关系的
弧集合T中确定出弧Aj,其中弧Aj与弧Ai表示相同的词语,或者弧Aj与其所
连接弧组合构成与弧Ai表示相同的词语;结合弧Ai和弧Aj的置信度,或进一
步结合所述弧Aj所连接弧的置信度确定弧Ai表示的词语的置信度。
2.根据权利要求1所述的方法,其特征在于,在所述步骤S1中,每条弧
的置信度等于经过该弧的所有路径的得分之和除以词图中所有路径的得分之和
所得到的值。
3.根据权利要求1所述的方法,其特征在于,在所述步骤S2中确定两条
弧是否存在竞争关系时,采用以下方式:
如果两条弧在持续时间上存在交叠,则确定两条弧存在竞争关系;或者,
如果两条弧在持续时间上存在交叠,且两条弧表示的词语在发音上的相似度
满足预设要求,则确定两条弧存在竞争关系。
4.根据权利要求1所述的方法,其特征在于,所述S3具体包括:
S31、初始化弧Ai表示的词语的置信度为弧Ai的置信度;
S32、从与所述弧Ai存在竞争关系的弧集合T中选择一条未被选择过的弧;
S33、判断选择的弧是否与弧Ai表示相同的词语,如果是,将弧Ai表示的
词语的置信度更新为该词语的置信度当前值加上选择的弧的置信度,执行步骤
S35;否则,执行步骤S34;
S34、判断选择的弧与其所连接的弧组合是否与弧Ai表示相同的词语,如果
是,结合弧Ai表示的词语的置信度当前值以及所述弧组合中各弧的置信度更新
弧Ai表示的词语的置信度,执行步骤S35;否则直接执行步骤S35;
S35、判断所述弧集合T中是否还存在未被选择的弧,如果是,转至所述步
骤S32;否则,结束弧Ai表示的词语的置信度确定流程。
5.根据权利要求4所述的方法,其特征在于,在步骤S34中所述结合弧
Ai表示的词语的置信度当前值以及所述弧组合中各弧的置信度更新弧Ai表示的
词语的置信度具体为:
将弧Ai表示的词语的置信度更新为该词语的置信度当前值加上所述弧组合
中各弧的置信度最小值。
6.一种确定语音识别结果置信度的装置,其特征在于,该装置包括:

【专利技术属性】
技术研发人员:李新辉
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有1条评论
  • 来自[北京市电信互联网数据中心] 2014年12月09日 06:33
    定语是用来修饰限定说明名词或代词的品质与特征的主要有形容词此外还有名词代词数词介词短语动词不定式短语分词定语从句或相当于形容词的词短语或句子都可以作定语汉语中常用……的表示
    0
1