词语验证的方法及装置制造方法及图纸

技术编号:10068754 阅读:158 留言:0更新日期:2014-05-23 11:45
本发明专利技术公开了一种词语验证的方法及装置,用于验证语音辨识所输出的辨识词汇。词语验证的装置包括:参考分数累积器、验证分数产生器以及决策装置。本发明专利技术根据语音辨识时的相似度分数,对相似度分数进行处理,而相似度分数是在每一模型词汇的状态之一的条件下,输入语音的特征向量之一的机率函数值再取对数而获得。本发明专利技术又根据处理后的结果来产生验证分数,且将验证分数与预设门槛值比较,以拒绝或接受辨识词汇。

【技术实现步骤摘要】
词语验证的方法及装置
本专利技术是有关于一种词语验证的技术,特别涉及一种词语验证的方法及装置。
技术介绍
语音辨识(speechrecognition)的应用层面相当广泛,例如电话查询系统、大楼门禁管制系统、汽车电脑系统、声控玩具、以及近年来最热门的无线通讯装置等。现今语音辨识系统的架构主要是以隐藏式马可夫模型(HiddenMarkovModel,HMM)最具代表性。虽然语音辨识的应用如此广泛,但其辨识的正确性却实际影响了使用的普及性。基于此,目前多数语音辨识的研究仍着眼于正确率的提升。词语验证(utteranceverification)功能是语音辨识系统中不可或缺的一部份,其能够有效拒绝集合外词汇(outofvocabulary)的语音或噪音噪声所造成错误的语音辨识结果,以提升语音辨识的正确性与可靠度。常见的技术例如是以类神经网络模型(NeuralNetworkModel)、垃圾正规化(garbagenormalization)或是N最佳信心度(N-bestbasedconfidence)等来对辨识出的词汇进行词语验证。然而,上述词语验证的技术需要有额外的运算以及足够的存储器空间来储存模型,或是需要由于不同的环境而改变设定。有鉴于此,提供一个效果良好且不耗费过大运算与存储器空间的词语验证的方法,已成为当务之急。
技术实现思路
本专利技术提出一种词语验证的方法,用于验证语音辨识所输出的辨识词汇,其中辨识词汇是根据声学模型与模型词汇数据库对特征向量序列进行语音辨识后所获得,前述特征向量序列包括多个音框的特征向量,前述声学模型与模型词汇数据库包括多个模型词汇,每一模型词汇包括多个状态。此词语验证的方法根据语音辨识时的相似度分数,并对相似度分数进行处理,其中前述相似度分数是在每一模型词汇的这些状态之一的条件下,由这些音框的特征向量之一的机率函数值再取对数而获得,此词语验证的方法再根据处理后的结果来产生验证分数,且将验证分数与预设门槛值比较,以对辨识词汇拒绝与接受二者择一。进行语音辨识时还输出最佳路径分数,而根据语音辨识时的该相似度分数,对该相似度分数进行处理的步骤,包括:分别针对每一模型词汇计算最大参考分数,其中该最大参考分数是每一音框的特征向量于某一模型词汇中的各个状态的条件下分别计算其相似度分数,再取所计算出的该相似度分数中的最大值进行加总而得。根据处理后的结果来产生该验证分数的步骤包括:根据该最佳路径分数以及对应于该辨识词汇的该最大参考分数来计算该验证分数。计算该验证分数的公式为:其中t为特征向量在特征向量序列中的音框序号,ot为序号t音框的特征向量,T为特征向量的音框总数,si为模型词汇m的状态之一,为模型词汇m的状态所组成的集合,为模型词汇m的第N个状态,log(Pr(ot|si))为特征向量ot在状态si的条件下所取得的相似度分数,为对应于模型词汇m的最大参考分数,为最佳路径分数。进行语音辨识时还输出最佳路径分数,而根据语音辨识时的该相似度分数,对该相似度分数进行处理的步骤,包括:计算总最大参考分数,其中该总最大参考分数是每一音框的特征向量于每一模型词汇中的各个状态的条件下分别计算其相似度分数,再取所计算出的该相似度分数中的最大值进行加总而得。根据处理后的结果来产生该验证分数的步骤包括:根据该最佳路径分数以及该总最大参考分数来计算该验证分数。计算该验证分数的公式为:其中t为特征向量在特征向量序列中的音框序号,ot为序号t音框的特征向量,T为特征向量的音框总数,si为模型词汇m的状态之一,为模型词汇m的状态所组成的集合,为模型词汇m的第N个状态,M为模型词汇的总数,log(Pr(ot|si))为特征向量ot在状态si的条件下所取得的相似度分数,为总最大参考分数,为最佳路径分数。进行语音辨识时还输出最佳路径分数,而根据语音辨识时的该相似度分数,对该相似度分数进行处理的步骤,包括:计算总最大参考分数以及根据垃圾模型来计算垃圾分数,其中,该总最大参考分数是每一音框的特征向量于每一模型词汇中的各个状态的条件下分别计算其相似度分数,再取所计算出的该相似度分数中的最大值进行加总而得,而该垃圾分数是该些特征向量之一于该垃圾模型的条件下的机率函数值再取对数后加总而获得。根据处理后的结果来产生该验证分数的步骤包括:根据该最佳路径分数、该垃圾分数以及该总最大参考分数来计算该验证分数。计算该验证分数的公式为:其中t为特征向量在特征向量序列中的音框序号,ot为序号t音框的特征向量,T为特征向量的音框总数,si为模型词汇m的状态之一,λg为垃圾模型的状态,为模型词汇m的状态所组成的集合,为模型词汇m的第N个状态,M为模型词汇的总数,log(Pr(ot|si))为特征向量ot在状态si的条件下所取得的相似度分数,log(Pr(ot|λg))为特征向量ot于垃圾模型的状态条件下所取得的相似度分数,为总最大参考分数,为最佳路径分数,为垃圾分数。进行语音辨识时还输出最佳路径分数,而根据语音辨识时的该相似度分数,对该相似度分数进行处理的步骤,包括:计算总最大参考分数以及总最小参考分数,其中,该总最大参考分数与总最小参考分数分别是每一音框的特征向量于每一模型词汇中的各个状态的条件下分别计算其相似度分数,再取所计算出的该相似度分数中的最大值与最小值分别进行加总而得。根据处理后的结果来产生该验证分数的步骤包括:根据该最佳路径分数、该总最大参考分数以及该总最小参考分数来计算该验证分数。该验证分数的公式为:...
词语验证的方法及装置

【技术保护点】
一种词语验证的方法,用于验证辨识词汇,其特征在于,该辨识词汇是根据声学模型与模型词汇数据库对特征向量序列进行语音辨识后所得,该特征向量序列包括多个音框的特征向量,该声学模型与模型词汇数据库包括多个模型词汇,每一模型词汇包括多个状态,该词语验证的方法包括:根据语音辨识时的相似度分数,对该相似度分数进行处理,其中该相似度分数是在每一模型词汇的该些状态之一的条件下,该些音框的特征向量之一的机率函数值再取对数而获得;根据处理后的结果来产生验证分数;以及将该验证分数与预设门槛值比较,以对该辨识词汇拒绝与接受二者择一。

【技术特征摘要】
2012.11.08 TW 1011416721.一种词语验证的方法,用于验证辨识词汇,其特征在于,该辨识词汇是根据声学模型与模型词汇数据库对特征向量序列进行语音辨识后所得,该特征向量序列包括多个音框的特征向量,该声学模型与模型词汇数据库包括多个模型词汇,每一模型词汇包括多个状态,该词语验证的方法包括:根据语音辨识时的相似度分数,分别针对每一模型词汇计算一最大参考分数,其中该相似度分数是在每一模型词汇的该些状态之一的条件下,该些音框的特征向量之一的机率函数值再取对数而获得,而该最大参考分数是每一音框的特征向量于某一模型词汇中的各个状态的条件下分别计算其相似度分数,再取所计算出的该相似度分数中的最大值进行加总而得;根据语音辨识时输出的一最佳路径分数以及对应于该辨识词汇的该最大参考分数,计算一第一验证分数;以及将该第一验证分数与一第一预设门槛值比较,以对该辨识词汇拒绝与接受二者择一。2.如权利要求1所述的词语验证的方法,其特征在于,计算该第一验证分数的公式为:其中t为特征向量在特征向量序列中的音框序号,ot为序号t音框的特征向量,T为特征向量的音框总数,si为模型词汇m的状态之一,为模型词汇m的状态所组成的集合,为模型词汇m的第N个状态,log(Pr(ot|si))为特征向量ot在状态si的条件下所取得的相似度分数,为对应于模型词汇m的最大参考分数,为最佳路径分数。3.一种词语验证的方法,用于验证一辨识词汇,其中该辨识词汇是根据一声学模型与模型词汇资料库对一特征向量序列进行语音辨识后所得,该特征向量序列包括多个音框的特征向量,该声学模型与模型词汇资料库包括多个模型词汇,每一模型词汇包括多个状态,该词语验证的方法包括:根据语音辨识时的一相似度分数,计算总最大参考分数,其中该相似度分数是在每一模型词汇的该些状态之一的条件下,该些音框的特征向量之一的机率函数值再取对数而获得,而该总最大参考分数是每一音框的特征向量于每一模型词汇中的各个状态的条件下分别计算其相似度分数,再取所计算出的该相似度分数中的最大值进行加总而得;根据语音辨识时输出的一最佳路径分数以及该总最大参考分数,计算一第二验证分数;以及将该第二验证分数与一第二预设门槛值比较,以对该辨识词汇拒绝与接受二者择一。4.如权利要求3所述的词语验证的方法,其特征在于,计算该第二验证分数的公式为:其中t为特征向量在特征向量序列中的音框序号,ot为序号t音框的特征向量,T为特征向量的音框总数,si为模型词汇m的状态之一,为模型词汇m的状态所组成的集合,为模型词汇m的第N个状态,M为模型词汇的总数,log(Pr(ot|si))为特征向量ot在状态si的条件下所取得的相似度分数,为总最大参考分数,为最佳路径分数。5.如权利要求3所述的词语验证的方法,其特征在于,更包括:根据垃圾模型来计算垃圾分数,其中该垃圾分数是该些特征向量之一于该垃圾模型的条件下的机率函数值再取对数后加总而获得;根据该最佳路径分数、该垃圾分数以及该总最大参考分数来计算一第三验证分数;以及将该第三验证分数与一第三预设门槛值比较,以对该辨识词汇拒绝与接受二者择一。6.如权利要求5所述的词语验证的方法,其特征在于,计算该第三验证分数的公式为:其中t为特征向量在特征向量序列中的音框序号,ot为序号t音框的特征向量,T为特征向量的音框总数,si为模型词汇m的状态之一,λg为垃圾模型的状态,为模型词汇m的状态所组成的集合,为模型词汇m的第N个状态,M为模型词汇的总数,log(Pr(ot|si))为特征向量ot在状态si的条件下所取得的相似度分数,log(Pr(ot|λg))为特征向量ot于垃圾模型的状态条件下所取得的相似度分数,为总最大参考分数,为最佳路径分数,为垃圾分数。7.如权利要求3所述的词语验证的方法,其特征在于,更包括:计算总最小参考分数,其中,该总最小参考分数分别是每一音框的特征向量于每一模型词汇中的各个状态的条件下分别计算其相似度分数,再取所计算出的该相似度分数中的最小值分别进行加总而得;根据该最佳路径分数、该总最大参考分数以及该总最小参考分数来计算一第四验证分数;以及将该第四验证分数与一第四预设门槛值比较,以对该辨识词汇拒绝与接受二者择一。8.如权利要求7所述的词语验证的方法,其特征在于,该验证分数的公式为:其中t为特征向量在特征向量序列中的音框序号,ot为序号t音框的特征向量,T为特征向量的音框总数,si为模型词汇m的状态之一,为模型词汇m的状态所组成的集合,为模型词汇m的第N个状态,M为模型词汇的总数,log(Pr(ot|si))为特征向量ot在状态si的条件下所取得的相似度分数,为总最大参考分数,为最佳路径分数,为总最小参考分数。9.一种词语验证的装置,用于验证语音辨识装置所输出的辨识词汇,其特征在于,该辨识词汇是根据声学模型与模型词汇数据库对特征向量序列进行语音辨识后所得,该特征向量序列包括多个音框的特征向量,该声学模型与模型词汇数据库包括多个模型词汇,每一模型词汇包括多...

【专利技术属性】
技术研发人员:简世杰
申请(专利权)人:财团法人工业技术研究院
类型:发明
国别省市:台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1