【技术实现步骤摘要】
本专利技术涉及语音识别系统,更具体地涉及一种在。大部分讲话者有关语音识别系统没有能力检测由于词汇外(OOV)词或被环境噪音所严重破坏的发声所引起的识别误差。其结果是,不必要的识别误差可能使用户失望和使本来可靠的语音识别系统的可察觉的优点显示不出来。误差检测是语音识别系统为改善它们总体可用性所必需的手段。对于一个单独的词,命令和控制型识别器而言,会遇到三类识别误差。第一类误差称为删除误差,当输入发声或未被识别为任何词或被识别为环境噪音时即发生此类误差。在此情况下,用户接口应恰当处理此类误差并重新提示用户重复该发声。第二类误差是插入误差,当用户未说任何词而系统识别一个不正确词时,发生这类误差。最后,第三类误差是替代误差,识别到不正确词而不是正确发声时发生此类误差。当用户或说有效词汇中词或不留意地输入OOV发声时这都能发生。在讲话者有关识别系统中,当用户试图选用他们并未录用的词或当它们已忘记以前录用过词的准确发声时,通常会输入词汇外发声。语音识别器也会将特别大的背景噪音或背景谈话误认为有效输入发声。所造成的替代和插入误差会最具有危害性,因系统可能因此启动非法操作,而以后用户还必须取消此操作。识别并恰当地处理这两类识别误差的能力可以显著提高语音识别系统的总体性能。此外,在语音识别系统用于手忙或眼忙情况(如开车时)的事件中,系统应避免要求用户付出不必要的注意力。已研究和实施了许多供单独的和连续型的识别系统用于检测识别误差的涉及基于阈值的可靠度度量的技术。已使用基于N-最佳维特比(Viterbi)搜索结果的可靠度度量。虽然这些技术对识别一定替代误差是有用的,但它 ...
【技术保护点】
一种在语音识别系统中评估发声的方法,所述方法包括以下步骤: 在所述语音识别系统中接收新训练数据; 为所述新训练数据计算统计参数; 根据所述统计参数为所述新训练数据计算全局统计参数;以及 根据所述全局统计参数更新一个废料模型。
【技术特征摘要】
US 1998-1-30 0162141.一种在语音识别系统中评估发声的方法,所述方法包括以下步骤在所述语音识别系统中接收新训练数据;为所述新训练数据计算统计参数;根据所述统计参数为所述新训练数据计算全局统计参数;以及根据所述全局统计参数更新一个废料模型。2.权利要求1的评估发声的方法,其中所述为所述新训练数据计算统计参数的步骤包括为所述新训练数据计算均值和协方差。3.权利要求1的评估发声的方法,其中所述计算全局统计参数的步骤包括为所述新训练数据计算全局均值和全局协方差。4.权利要求1的评估发声的方法,其中所述计算全局统计参数的步骤包括根据先前全局统计参数和所述统计参数为所述新训练数据计算全局统计参数。5.权利要求1的评估发声的方法,其中所述计算全局统计参数的步骤包括根据在开始训练过程之前自可用的训练数据的数据库中推导出的先前全局均值和先前全局方差及所述新数据的所述均值和所述方差来计算全局统计参数。6.权利要求1的评估发声的方法,其中所述更新废料模型的步骤包括生成单状态HMM。7.权利要求1的评估发声的方法,进一步包括接收新识别数据并将所述新识别数据的模型与先前存放于所述语音识别系统中的众多模型进行比较的步骤。8.权利要求7的评估发声的方法,其中所述比较所述新识别数据的模型的步骤进一步包括在逐帧基础上搜索数据和为每帧所述新识别数据生成每个模型的更新值的步骤。9.权利要求8的评估发声的方法,进一步包括当评估所述废料模型时使用定标系数为所述更新值加权的步骤。10.权利要求9的评估发声的方法,其中所述为所述更新值加权的步骤包括根据环境条件使用定标系数调整所述更新值。11.权利要求10的评估发声的方法,其中所述为所述更新值加权的步骤进一步包括感测所述环境条件中变化的步骤。12.权利要求9的评估发声的方法,进一步包括以下步骤如果所述废料模型在与所有其它有效模型一起评估时被选为最佳模型,则排除所述发声。13.权利要求9的评估发声的方法,其中所述为所述更新值加权的步骤包括在逐帧基础上为所述更新值加权。14.权利要求7的评估发声的方法,其中所述比较所述新识别数据的模型的步骤包括在逐个模型基础上搜索数据和为所述新识别数据的每个模型生成一个更新值。15.权利要求14的评估发声的方法,进一步包括当评估所述废料模型时使用定标系数为所述更新值加权的步骤。16.权利要求15的评估发声的方法,其中所述为所述更新值加权的步骤包括根据环境条件使用定标系数调整所述更新值。17.权利要求16的评估发声的方法,其中所述为所述更新值加权的步骤进一步包括感测所述环境条件中变化的步骤。18.权利要求15的评估发声的方法,进一步包括以下步骤如果所述废料模型在与所有其它有效模型一起评估时被选为最佳模型,则排除所述发声。19.权利要求15的评估发声的方法,其中所述为所述更新值加权的步骤包括在逐帧基础上为所述更新值加权。20.一种在用于接收数据的讲话者有关语音识别系统中评估发声的方法,所述方法包括以下步骤接收用户供给的训练数据;计算所述新训练数据统计参数;根据所述均值和所述协方差为所述新训练数据计算全局均值和全局方差;以及根据所述全局均值和所述全局协方差更新废料模型。21.权利要求20的评估发声的方法,其中计算所述新训练数据统计参数的步骤包括计算所述新训练数据的均值和协方差。22.权利要求20的评估发声的方法,其中所述计算全局统计参数的步骤包括计算所述新训...
【专利技术属性】
技术研发人员:爱德华斯普伦格,杰弗里A穆昂尔,威廉M库什纳,
申请(专利权)人:摩托罗拉公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。