用于符号序列的语音识别的方法和系统技术方案

技术编号:3046313 阅读:230 留言:0更新日期:2012-04-11 18:40
描述了符号序列的语音识别方法,更加具体地说描述了数字序列的语音识别方法。首先借助于语音输出设备(5、6、7)输出由用户发出的并由系统识别的第一符号序列以便由用户确认。如果错误地识别第一符号序列,则识别由用户发出的第二符号序列,并且使第二符号序列与第一符号序列比较。然后确定第一符号序列的子符号序列,这个子符号序列部分地对应于第二符号序列并且相对于第二符号序列具有最低数目和/或预先确定数目的偏差。最后,借助于第二符号序列在子符号序列范围内校正第一符号序列。按照所说的方法之一,校正的子符号序列的确定包括比较第二符号序列与比第二符号序列或长或短的第一符号序列的这种子符号序列。按照另一种方法,确定并输出第一符号序列的各种可替换的校正版本以便用户确认,一直到收到可替换的校正版本或异常终止命令的肯定确认时为止,或者一直到达到作为终止标准确定的限值时为止。此外,还描述了用于符号序列的语音识别的对应的系统。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及符号序列的语音识别的各种方法,其中首先借助于用户确认的语音输出设备输出语音识别的第一符号序列,并且在错误地识别第一符号序列的情况下识别语音的第二符号序列并且使其与第一符号序列进行比较,同时确定第一符号序列的一个子符号序列,所说的子符号序列部分地与第二符号序列相对应并且相对于第二符号序列具有最低数目的和/或预先确定数目的偏差,最后,借助于第二符号序列在所说子符号序列的位置校正第一符号序列。进而,本专利技术涉及相应的系统,用于通过识别语音符号序列和命令的语音识别设备对于符号序列进行语音识别,所说的系统包括语音输出设备,用于输出通过用户确认的语音识别的第一符号序列;比较设备,用于在错误识别第一符号序列的情况下比较语音识别的第二符号序列与第一符号序列,并且然后确定第一符号序列的一个子符号序列,所说的子符号序列部分地对应于第二符号序列并且相对于第二符号序列具有最小数目的和/或预先确定的数目的偏差;和校正设备,用于根据第二符号序列在子符号序列的位置校正第一符号序列。
技术介绍
在EP0865031A2中,公开了在本文第一段中定义的这种类型的方法。那里描述的方法是一种语音识别数字序列(如电话号码)的方法。为了避免具有错误识别的数字序列的语音应用事项,识别的数字序列首先要输出给这个用户。然后,用户或者可能了解识别的数字序列的校正情况,或者有可能输入第二数字序列来校正第一数字序列。这可能是一个完全新的数字序列,但是还可能有一部分数字序列没有正确识别。由于只输入一部分原始符号序列以此作为第二符号序列,所以首先输入的数字序列的所有子序列都要与第二数字序列比较,第二数字序列即一种校正数字序列,它和第二数字序列具有相同的长度。然后,找到与第二数字序列相比具有最小数目偏差的第一数字序列的子序列,在子数字序列中与第二数字序列不同的数字由第二数字序列的数字代替。这种方法的优点是用户不必再次输入完整的第一数字序列,只输入一部分第一数字序列即可重复被认为是错误的数字。这样一种校正形式对应于用户与其它人谈话时的自然而且熟悉的对话形式。进而,它比再次输入完整的新的数字序列要快。此外,这种校正方法的预期成功结果是较大的,因为只输入一部分数字序列,引入新的识别误差的可能性较小。然而,利用这种方法,只校正在某个数字位置的被认为是错误数字的误差。更加具体地说,当在大量的环境噪声中进行语音输入时,经常可能发生的是,这个系统完全不能识别数字,或者是识别出不是用户本人输入的附加的错误数字。然而,这样的误差不可能用上述的方法校正。此外,这个系统只能输出初始识别的数字序列的某个校正的版本。如果这不是正确的校正,用户就要重新输入一个数字序列或者子数字序列。在为了校正输入的第二数字序列明显地与初次识别的数字序列的某个子序列不匹配的情况下,必须有来自用户的更多的反馈。这种校正方法可能需要相当长的时间,因而最好重新输入一个完整的第一数字序列。
技术实现思路
本专利技术的一个目的是改进在本文开始段中定义的那种类型的方法,它可使对于被认为是错误的符号序列的校正更加简单、快速、使用户更舒服。按照本专利技术的一种变形,通过在本文开始段中定义的那种类型的方法实现这个目的,其中确定用于校正的子符号序列包括比较第二符号序列与这样的第一符号序列的子符号序列,第一符号序列的子符号序列是比第二符号序列或长或短的一系列符号。这应该被理解为要检查在子符号序列中的至少一个符号位置是否定位了不同于第二符号序列的符号,检查不同于第二符号序列的子符号序列是否具有至少一个附加的符号,或者在不同于第二符号序列的子符号序列中是否缺少至少一个符号。这样就可以实现,在一个符号被完全识别或者用户没有说出的符号被错误识别的情况下所说的方法还能够发挥作用。为了在匹配子符号序列后确定第一符号序列,所说的第一符号序列是要通过第二符号序列校正的,存在下面的可能性 在优选实施例中,首先寻找与第二符号序列具有相同长度的子符号序列,在此之后要寻找比第二符号序列长的至少一个子符号序列,最后要寻找比第二符号序列短的至少一个子符号序列。选择这个顺序的理由是,一个符号被错误理解的可能性要比一个符号被理解为是多余的或者全然没有被理解的可能性要大些。此外,在大多数语音识别系统中,例如由于背景噪声的结果,不理解附加符号的可能性比不识别发声符号的可能性更大些。优选的作法还有,首先在准确的一个符号位置寻找相对于第二符号序列有偏差的这种子符号序列,而所说的偏差可能是另一个符号、缺少一个符号、或者多余一个符号。随后,首先在准确的两个符号位置寻找有这种偏差的子符号序列。如果在这次寻找期间没有确定任何合适的子符号序列,这次寻找异常终止,要求用户输入完全新的输入,因为包含超过两个符号变化的校正的几率相当地小。在特定的优选实施例中,在确定子符号序列时,寻找下述类型的子符号序列的偏差1.与第二符号序列具有相同长度并且在一定数目的符号位置与第二符号序列具有不同符号的子符号序列。2.与第二符号序列相比在一定数目的符号位置具有附加的符号、并且在其它的符号位置与第二符号序列匹配或者在一定数目的符号位置具有与第二符号序列不同符号的子符号序列。3.与第二符号序列相比在一定数目的符号位置缺少一个符号、并且其它的符号位置与第二符号序列匹配或者在一定数目的符号位置具有与第二符号序列不同的符号。存在不同符号的符号位置下面称之为“错误填充”,缺少符号或者存在多余符号的符号位置下面称之为“错误位置”。错误填充和/或错误位置以及错误位置的类型(一个符号太多或太少)的数量可以作为寻找的参数预先确定。例如,在第一步,可以针对具有相等长度但不同符号的子符号序列、较短一个符号的子符号序列、以及恰好较长一个符号的子符号序列进行特定的寻找。然后,在下一步,可以寻找具有两个错误填充的子符号序列以及具有一个错误填充和一个错误位置这两者的子符号序列。这意味着在这第二步可以寻找在两个位置具有偏差的一定数量的子符号序列。还可以寻找具有恰好3个预先确定的偏差的子符号序列,如此等等。优选地,在第一符号序列中,针对这些类型偏差中的每一种偏差,寻找具有期望数目的某些偏差(即,某些数目的错误位置和/或错误填充)的恰好一个子符号序列。然后,比较第二符号序列与第一符号序列中的对应的不同子符号序列,这些子符号序列中的每一个都具有与第二符号序列对应的以及与对应的偏差类型对应的长度。在这种比较中,从形成第一符号序列的一端的子符号序列开始。然后,逐步地在第一符号序列中将要进行比较的子符号序列向前移动一个符号序列,一直到在这一端找到具有期望的偏差类型的子符号序列时为止。然后终止对于对应类型的子符号序列的寻找。如果没有找到任何一个期望的子符号序列,继续寻找,一直到最后将第二符号序列与形成第一符号序列的开始的子符号序列进行比较时为止,即,一直到抵达第一符号序列的开始时为止。按照这种方法,假定用户在输入第二符号序列时具有再次输入整个符号序列的趋势,所说的整个符号序列从错误位置开始已被错误识别。作为这个比较顺序的结果,从子符号序列定位在第一符号序列的一端开始,最后可实现,有可能正确地识别错误并且极其快速地校正这个错误。第二符号序列与第一符号序列的较长的子符号序列的比较最好是按照以下的方式实现在子符号序列的产生变化的符号位本文档来自技高网
...

【技术保护点】
一种符号序列的语音识别的方法,其中首先借助于用户确认的语音输出设备输出语音识别的第一符号序列,并且在错误地识别第一符号序列的情况下识别语音的第二符号序列并且使其与第一符号序列进行比较,同时部分地确定第一符号序列的一个子符号序列,所说的子符号序列与第二符号序列相对应并且相对于第二符号序列具有最低数目的和/或预先确定数目的偏差,最后,借助于第二符号序列在所说子符号序列的位置校正第一符号序列,其特征在于:确定用于校正的子符号序列包括:比较第二符号序列与第一符号序列的这样的子符号序列,第一符号序列是比第二符号序列或长或短的一系列符号。

【技术特征摘要】
【国外来华专利技术】DE 2002-4-12 10216117.81.一种符号序列的语音识别的方法,其中首先借助于用户确认的语音输出设备输出语音识别的第一符号序列,并且在错误地识别第一符号序列的情况下识别语音的第二符号序列并且使其与第一符号序列进行比较,同时部分地确定第一符号序列的一个子符号序列,所说的子符号序列与第二符号序列相对应并且相对于第二符号序列具有最低数目的和/或预先确定数目的偏差,最后,借助于第二符号序列在所说子符号序列的位置校正第一符号序列,其特征在于确定用于校正的子符号序列包括比较第二符号序列与第一符号序列的这样的子符号序列,第一符号序列是比第二符号序列或长或短的一系列符号。2.根据权利要求1所述的方法,其特征在于首先寻找与第二符号序列具有相同长度的子符号序列,在此之后寻找比第二符号序列长的至少一个子符号序列,最后寻找比第二符号序列短的至少一个子符号序列。3.根据权利要求1或2所述的方法,其特征在于在确定第一符号序列的子符号序列时,寻找在恰好一个符号位置相对于第二符号序列有偏差的子符号序列,最后,寻找在恰好两个符号位置相对于第二符号序列有偏差的子符号序列,而所说的偏差可能是另一个符号、缺少一个符号、或者多余一个符号。4.根据权利要求1-3中任何一个所述的方法,其特征在于在确定第一符号序列的子符号序列时,寻找下述类型的子符号序列的偏差-与第二符号序列具有相同长度并且在一定数目的符号位置与第二符号序列具有不同符号的子符号序列,-与第二符号序列相比在一定数目的符号位置具有附加的符号、并且在其它的一定数目的符号位置与第二符号序列匹配一致或者具有与第二符号序列不同符号的子符号序列,-与第二符号序列相比在一定数目的符号位置缺少一个符号、并且在其它的一系列符号位置与第二符号序列匹配一致或者具有与第二符号序列不同的符号的子符号序列。5.根据权利要求4所述的方法,其特征在于对于某种类型的偏差,寻找第一符号序列的刚好一个子符号序列并且总是比较第二符号序列与第一符号序列的各种子符号序列,第一符号序列的各种子符号序列每一个都具有与第二符号序列和偏差类型匹配的长度,这里对应的比较是从形成第一符号序列的端部的子符号序列开始的,然后用于比较的子符号序列在第一符号序列中逐步地向前移动一个符号位置,一直到找到有期望类型偏差的子符号序列时为止,或者一直到第二符号序列最终与形成第一符号序列的开始端的子符号序列比较时为止。6.根据权利要求1-5中任何一个所述的方法,其特征在于当第二符号序列与第一符号序列的较长的子符号序列比较时,在比较期间,在对应的子符号序列的产生变化的符号位置忽略一个符号,并且将对应的其余子符号序列与第二符号序列进行比较;并且,当第二符号序列与第一符号序列的较短的子符号序列比较时,在比较期间,在对应的第二符号序列的产生变化的符号位置忽略一个符号,并且将第二符号序列的对应的其余序列与子符号序列进行比较。7.一种符号序列的语音识别方法,其中首先借助语音输出设备(5、6、7)输出语音识别的第一符号序列以备用户...

【专利技术属性】
技术研发人员:R布雷尔
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1