语音识别结果纠错方法和装置制造方法及图纸

技术编号:14341647 阅读:190 留言:0更新日期:2017-01-04 13:38
本申请提出一种语音识别结果纠错方法和装置,该语音识别结果纠错方法包括:对待纠正的语音识别结果进行注音,得到所述语音识别结果对应的拼音;根据所述拼音获取候选文本,并在候选文本中确定最优候选文本;判断所述最优候选文本是否满足预设条件;如果满足预设条件,将所述最优候选文本确定为所述待纠正的语音识别结果的纠正结果。该方法能够提高纠正结果的准确度。

【技术实现步骤摘要】

本申请涉及语音识别
,尤其涉及一种语音识别结果纠错方法和装置
技术介绍
语音识别用于将语音识别为文本,语音识别结果纠错是语音理解过程中的一项重要工作。受限于语音识别的准确性,语音识别结果常常会出现错误,这将对语音理解的后续工作造成障碍,增加了语音理解的难度。语音识别结果纠错可以对一些识别错误的结果进行纠正,从而提高语音理解的准确性。目前并没有主流的语音识别结果纠错的方案,一般是基于词的识别结果概率信息的统计方法,纠正结果的准确度有待提高。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种语音识别结果纠错方法,该方法可以实现基于拼音输入法的语音识别结果纠错,提高纠正结果的准确度。本申请的另一个目的在于提出一种语音识别结果纠错装置。为达到上述目的,本申请第一方面实施例提出的语音识别结果纠错方法,包括:对待纠正的语音识别结果进行注音,得到所述语音识别结果对应的拼音;根据所述拼音获取候选文本,并在候选文本中确定最优候选文本;判断所述最优候选文本是否满足预设条件;如果满足预设条件,将所述最优候选文本确定为所述待纠正的语音识别结果的纠正结果。本申请第一方面实施例提出的语音识别结果纠错方法,通过对待纠正的语音识别结果进行注音,并根据拼音获取候选文本,以及在最优候选文本满足预设条件时将最优候选文本作为纠正结果,可以实现基于拼音输入法的语音识别结果纠错,提高纠正结果的准确度。为达到上述目的,本申请第二方面实施例提出的语音识别结果纠错装置,包括:注音模块,用于对待纠正的语音识别结果进行注音,得到所述语音识别结果对应的拼音;获取模块,用于根据所述拼音获取候选文本,并在候选文本中确定最优候选文本;判断模块,用于判断所述最优候选文本是否满足预设条件;确定模块,用于在所述最优候选文本满足预设条件时,将所述最优候选文本确定为所述待纠正的语音识别结果的纠正结果。本申请第二方面实施例提出的语音识别结果纠错装置,通过对待纠正的语音识别结果进行注音,并根据拼音获取候选文本,以及在最优候选文本满足预设条件时将最优候选文本作为纠正结果,可以实现基于拼音输入法的语音识别结果纠错,提高纠正结果的准确度。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本申请一个实施例提出的语音识别结果纠错方法的流程示意图;图2是本申请另一个实施例提出的语音识别结果纠错方法的流程示意图;图3是本申请实施例中用于获取候选文本的解码网络的示意图;图4是本申请一个实施例提出的语音识别结果纠错装置的结构示意图;图5是本申请另一个实施例提出的语音识别结果纠错装置的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本申请一个实施例提出的语音识别结果纠错方法的流程示意图。参见图1,本实施例的方法包括:S11:对待纠正的语音识别结果进行注音,得到所述语音识别结果对应的拼音。其中,在语音识别得到语音识别结果后,可以根据已有或将来出现的技术,检测出语音识别结果中可能存在错误的结果,将这些可能存在错误的结果作为待纠正的语音识别结果。由于待纠正的语音识别结果是文本,因此可以采用对文本的注音方式完成对待纠正的语音识别结果的注音,得到待纠正的语音识别结果对应的拼音。具体的,待纠正的语音识别结果可以是汉字组成的句子,对应的拼音是指无音调的汉语拼音串。例如,待纠正的语音识别结果是“窝要去外滩”,对应的拼音是:woyaoquwaitanS12:根据所述拼音获取候选文本,并在候选文本中确定最优候选文本。其中,可以将拼音作为输入,根据发音词典构建解码网络,再根据语言模型计算解码网络中每条路径的得分,之后选择得分最高的N(可设置)条路径,将选择得到的每条路径对应的文本作为一个候选文本,从而得到N个候选文本。最优候选文本是指得分最高的一条路径对应的文本。S13:判断所述最优候选文本是否满足预设条件。预设条件可以根据需要设置,例如,可以比较最优候选文本与次优候选文本,比较最优候选文本与待纠正的语音识别结果,以及N-gram回退次数等。具体内容可以参见后续描述。S14:如果满足预设条件,将所述最优候选文本确定为所述待纠正的语音识别结果的纠正结果。另一方面,如果最优候选文本不满足预设条件,则保持待纠正的语音识别结果不变,即不进行纠正。本实施例中,通过对待纠正的语音识别结果进行注音,并根据拼音获取候选文本,以及在最优候选文本满足预设条件时将最优候选文本作为纠正结果,可以实现基于拼音输入法的语音识别结果纠错,提高纠正结果的准确度。图2是本申请另一个实施例提出的语音识别结果纠错方法的流程示意图。参见图2,本实施例的流程包括:S201:对待纠正的语音识别结果进行注音,得到所述语音识别结果对应的拼音。S202:获取通用语言模型,以及获取所述待纠正的语音识别结果对应的特定语言模型,并根据所述通用语言模型、所述特定语言模型和所述拼音获取候选文本。其中,通用语言模型是通常采用的语言模型,该语言模型是根据不区分领域的语料训练生成的。本实施例中,不仅会用到通用语言模型,还用到特定语言模型。特定语言模型的训练方式可以与通用语言模型的训练方式一致,两者区别在于采用的训练语料不同。特定语言模型是根据特定范围的语料训练生成的,特定范围可以是某一特定领域,比如,在地图领域,将收集的地名作为训练语料,从而得到地图领域对应的特定语言模型,类似的,还可以得到新闻领域对应的特定语言模型等。进一步的,特定范围还可以是某一特定领域进一步细分后的范围,同样以地图领域为例,可以对应每个城市生成一个语言模型,此时,特定语言模型例如包括:北京对应的特定语言模型,上海对应的特定语言模型等。以特定语言模型是城市对应的特定语言模型为例,可以根据用户输入的城市信息或者根据GPS定位得到的城市信息,获取城市对应的特定语言模型。在注音得到拼音后,可以根据拼音及发音词典组成解码网络。例如,一种解码网络如图3所示(图中只示出了一条路径,其余路径类似)。该解码网络输入的拼音为:woyaoquwaitan在构建出解码网络后,可以根据语言模型计算每条路径的得分。每条路径包括多个节点,每个节点对应一个词,从而每条路径对应一个候选文本。例如,“我”、“要”、“去”、“外滩”可以组成一条路径,“窝”、“要”、“去”、“外滩”也可以组成一条路径,“我”、“要”、“去”、“外”“谭”也可以组成一条路径。而每条路径的得分是根据语言模型得到的。在计算每条路径的得分时,可以根据该条路径上包含的n-gram词序列的得分相乘后得到。本实施例中,每个n-gram词序列的得分是根据通用语言模型确定的概率值与根据特定语言模型确定的概率值进行加权求和后得到的。以2-gram为例,对应“去”和“本文档来自技高网...
语音识别结果纠错方法和装置

【技术保护点】
一种语音识别结果纠错方法,其特征在于,包括:对待纠正的语音识别结果进行注音,得到所述语音识别结果对应的拼音;根据所述拼音获取候选文本,并在候选文本中确定最优候选文本;判断所述最优候选文本是否满足预设条件;如果满足预设条件,将所述最优候选文本确定为所述待纠正的语音识别结果的纠正结果。

【技术特征摘要】
1.一种语音识别结果纠错方法,其特征在于,包括:对待纠正的语音识别结果进行注音,得到所述语音识别结果对应的拼音;根据所述拼音获取候选文本,并在候选文本中确定最优候选文本;判断所述最优候选文本是否满足预设条件;如果满足预设条件,将所述最优候选文本确定为所述待纠正的语音识别结果的纠正结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述拼音获取候选文本,包括:获取通用语言模型,以及获取所述待纠正的语音识别结果对应的特定语言模型,并根据所述通用语言模型、所述特定语言模型和所述拼音获取候选文本。3.根据权利要求1所述的方法,其特征在于,在根据所述拼音获取候选文本之后,所述方法还包括:确定候选文本中的次优候选文本。4.根据权利要求3所述的方法,其特征在于,所述判断所述最优候选文本是否满足预设条件,包括:计算所述最优候选文本与所述次优候选文本的语言模型得分差值;如果所述差值大于第一预设值,获取字语言模型,并根据字语言模型对最优候选文本与待纠正语音识别结果进行打分;如果最优候选文本对应的得分大于所述待纠正语音识别结果对应的得分,采用词语言模型对最优候选文本进行打分,并统计打分过程中的回退次数;如果回退次数满足次数要求,则判断最优候选文本中连续单字的个数是否小于或等于第四预设值;如果是,则确定最优候选文本满足预设条件。5.根据权利要求4所述的方法,其特征在于,还包括:如果一元回退次数和二元回退次数的之和小于第二预设值,且总的回退次数之和小于第四预设值,则确定回退次数满足次数要求。6.根据权利要求...

【专利技术属性】
技术研发人员:姚树杰
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1