自动控制输入等级的语音识别系统及语音识别方法技术方案

技术编号:3045853 阅读:213 留言:0更新日期:2012-04-11 18:40
一种语音识别系统,包括:语音拾取元件,用于拾取来自外部演讲者语音;语音等级控制器,用于以语音识别器所提供的语音输入等级来接收所拾取的语音,并且将所接收的语音输出到语音识别器;语音检测器,用于从来自语音接收机的语音输出中检测语音识别所需的语音信号周期;语音饱和检测器,用于基于阈值确定所检测到的语音信号周期中的语音信号是否饱和;输入等级确定器,用于当语音信号周期中的语音信号饱和时,确定新语音输入等级,并且将关于新语音输入等级的信息输出到语音接收机,由此语音接收机以不饱和状态接收语音。一种语音识别方法包括与上述系统的功能相对应的步骤。

【技术实现步骤摘要】

本专利技术涉及一种语音识别系统,更具体地,涉及一种能够根据是否检测到输入语音的语音信号周期以及语音信号周期中的语音信号是否饱和来控制语音的输入等级的语音识别系统和语音识别方法。
技术介绍
一般来说,语音识别系统或方法通过使用频率分析方案的各种分析方法来产生输入语音的特征向量,并且利用所产生的特征向量来识别语音。这种语音识别系统或方法使用多种使用输入语音信号的能量的语音识别方案之一。在这种使用输入语音信号的能量的语音识别系统或方法中,为了识别语音,对输入语音信号的能量进行归一化,以最小化其中的偏差。在这一点上,不在特定的时刻单独检验输入语音信号的能量等级(或信号等级)。在现有的语音识别系统或方法中,存在这样的问题当由于语音信号的输入等级太低而导致语音检测失败时,或者当由于语音输入等级太高而导致某段时间内语音输入等级偏离语音输入分辨率时,语音识别率可能下降。然而,在这种情形中语音识别系统或方法不会补偿恶化的语音识别。这种语音识别系统或方法不会根据输入语音的等级来将语音输入等级控制在可用范围之内。因此,这种语音识别系统或方法会由于低输入等级而导致语音检测失败,或者会由于高语音输入等级而导致语音周期中输入信号饱和,这降低了语音识别率。因为语音识别系统或方法的用户从某一时刻开始多次连续使用这种系统或方法,而不是以确定的间隔周期性地使用,所以根据最初识别得到的输入等级校正可能会影响随后识别的概率较高。另外,当多个用户使用单个语音识别系统或方法时,可能在许多情形中语音音量和输入特性(例如,麦克风与演讲者之间的距离)参差不同。在这种情形中,应该在用户改变时实时控制语音识别系统或方法的语音输入等级。然而,在上述语音识别系统或方法中,每个单独用户必须手动控制语音输入等级。
技术实现思路
本专利技术的目的是提供一种语音识别系统以及使用这种系统的语音识别方法,该系统和方法能够通过分析用户所发出的语音(例如,将语音识别为语音识别周期中的语音)来自动且主动地控制语音输入等级。本专利技术的另一目的是提供一种能够通过自适应地改变语音音量并改变讲话方式来提高输入语音的检测率和识别率的语音识别系统和方法。根据本专利技术的实施例,提供了一种语音识别系统,包括语音接收机,用于以所设置的语音输入等级来拾取并接收语音,并且输出所接收的语音;和语音识别器,用于确定所述语音输入等级并且将其输出到所述语音接收机,该决定基于所接收的语音的语音信号周期中的语音信号是否饱和来做出,其中语音信号是否饱和基于阈值来确定。优选地,所述语音接收机包括语音拾取元件,用于拾取来自外部演讲者的语音;和语音等级控制器,用于以所述语音识别器所提供的语音输入等级来接收所拾取的语音,并且将所接收的语音输出到所述语音识别器。优选地,所述语音识别器包括语音检测器,用于从所述语音接收机接收到的语音中检测所述语音信号周期;语音饱和检测器,用于基于所述阈值确定所检测到的语音信号周期中的语音信号是否饱和;和输入等级确定器,用于在所述语音信号周期中的语音信号饱和时,确定新语音输入等级,并且将关于所述新语音输入等级的信息输出到所述语音接收机,由此所述语音接收机以不饱和状态接收语音。在一个实施例中,该系统还包括语音校正器,用于在确定所检测到的语音信号周期中的语音信号未饱和时,对所述语音检测器检测到的所述语音信号周期中的语音信号执行语音识别处理。所述语音检测器通过使用所述语音接收机接收到的语音信号的能量值以及过零率中的至少一个来检测所述语音信号周期。所述语音饱和检测器计算所述语音信号周期的平均能量值,并且如果所计算的平均能量值大于特定阈值,确定所述语音信号周期中的语音信号饱和。所述语音饱和检测器将所述语音信号周期划分为几个或几十个短周期,并且如果每个短周期中的语音信号的值大于语音输入分辨率,确定所述语音信号周期中的语音信号饱和。所述输入等级确定器在所述语音检测器不能检测所述语音信号周期时确定新语音输入等级。所述输入等级确定器在所述语音检测器不能检测所述语音信号周期时,确定所述新语音输入等级MicNEW为所设置的当前语音输入等级MicOLD与最大允许语音输入等级值MicMAX之间的中间值。所述输入等级确定器在所述语音饱和检测器确定所述语音信号周期中的语音信号饱和时,确定所述新语音输入等级MicNEW为所设置的当前语音输入等级MicOLD与最小允许语音输入等级值MicMIN之间的中间值。同时,根据本专利技术另一实施例,提供了一种使用语音识别系统的语音识别方法,该方法包括如下步骤以所设置的语音输入等级拾取、接收并输出语音;从所输出的语音中检测语音识别所需的语音信号周期;基于阈值,确定所检测到的语音信号周期中的语音信号是否饱和;当所述语音信号周期中的语音信号饱和时,确定新语音输入等级,以便以不饱和状态接收语音;以及以所述新语音输入等级拾取并接收语音。优选地,检测所述语音信号周期的步骤包括使用语音信号的能量值和过零率来检测所述语音信号周期。确定语音信号是否饱和的步骤包括计算所述语音信号周期的平均能量值,并且如果所计算的平均能量值大于特定阈值,确定所述语音信号周期中的语音信号饱和。确定语音信号是否饱和的步骤包括将所述语音信号周期划分为几个或几十个短周期,并且如果每个短周期中的语音信号的值大于语音输入分辨率,确定所述语音信号周期中的语音信号饱和。在所述语音信号周期的检测失败时执行确定所述新语音输入等级的步骤。确定所述新语音输入等级的步骤包括在检测所述语音信号周期的步骤不能检测所述语音信号周期时,确定所述新语音输入等级MicNEW为所设置的当前语音输入等级MicOLD与最大允许语音输入等级值MicMAX之间的中间值。确定所述新语音输入等级的步骤包括在确定语音信号是否饱和的步骤确定所述语音信号周期中的语音信号饱和时,确定所述新语音输入等级MicNEW为所设置的当前语音输入等级MicOLD与最小允许语音输入等级值MicMIN之间的中间值。根据本专利技术,通过根据是否从输入语音信号中检测到语音信号周期以及检测到的语音信号周期中的语音信号是否饱和来控制语音输入等级,可以减小从输入语音信号中检测语音的失败率以及由于语音信号饱和而引起的语音识别率的降低。另外,当语音信号周期检测失败或检测到的语音信号饱和时,通过主动控制语音输入等级而不是由用户直接控制语音输入等级来自适应地改变各个演讲者的语音音量并改变讲话方式(麦克风与演讲者的距离),可以减小语音检测失败率以及语音识别率的降低。附图说明结合附图,参考下面的详细描述,对本专利技术的更彻底的认识以及本专利技术所带有的许多优点将变得更加清楚,并且变得更好理解,在附图中相似的标号表示相同或相似的部件,其中图1图示了在语音识别系统不能检测语音时的结果的示例;图2图示了在语音识别系统不能检测语音时的结果的另一示例; 图3是根据本专利技术优选实施例、自动控制语音输入等级的语音识别系统的方框图;图4A和4B图示了在图3的语音检测器中通过使用语音信号的能量和过零率来检测语音信号周期的原理;以及图5是示出了使用根据本专利技术优选实施例的语音识别系统的语音识别方法的流程图。具体实施例方式图1图示了在语音识别系统不能检测语音时的结果的示例。参考图1,当由于输入语音的信号等级低于设置为语音识别周期的范围而不能进行语音检测时,本文档来自技高网
...

【技术保护点】
一种语音识别系统,包括:语音接收机,用于以所设置的语音输入等级来拾取并接收语音,并且输出所接收的语音;和语音识别器,用于确定所述语音输入等级并且将其输出到所述语音接收机,该决定基于所接收的语音的语音信号周期中的语音信号是否饱 和来做出,其中语音信号是否饱和基于阈值来确定。

【技术特征摘要】
KR 2004-12-7 10-2004-01026131.一种语音识别系统,包括语音接收机,用于以所设置的语音输入等级来拾取并接收语音,并且输出所接收的语音;和语音识别器,用于确定所述语音输入等级并且将其输出到所述语音接收机,该决定基于所接收的语音的语音信号周期中的语音信号是否饱和来做出,其中语音信号是否饱和基于阈值来确定。2.根据权利要求1所述的系统,其中所述语音接收机包括语音拾取元件,用于拾取来自外部演讲者的语音;和语音等级控制器,用于以所述语音识别器所提供的语音输入等级来接收所拾取的语音,并且将所接收的语音输出到所述语音识别器。3.根据权利要求1所述的系统,其中所述语音识别器包括语音检测器,用于从所述语音接收机的语音输出中检测所述语音信号周期;语音饱和检测器,用于基于所述阈值确定所检测到的语音信号周期中的语音信号是否饱和;和输入等级确定器,用于在所述语音信号周期中的语音信号饱和时,确定新语音输入等级,并且将关于所述新语音输入等级的信息输出到所述语音接收机,由此所述语音接收机以不饱和状态接收语音。4.根据权利要求3所述的系统,所述语音识别器还包括语音校正器,用于在确定所检测到的语音信号周期中的语音信号未饱和时,对所述语音检测器检测到的所述语音信号周期中的语音信号执行语音识别处理。5.根据权利要求3所述的系统,其中所述语音检测器通过使用所述语音接收机接收到的语音信号的能量值以及过零率中的至少一个来检测所述语音信号周期。6.根据权利要求3所述的系统,其中所述语音饱和检测器计算所述语音信号周期的平均能量值,并且当所计算的平均能量值大于特定阈值时,确定所述语音信号周期中的语音信号饱和。7.根据权利要求3所述的系统,其中所述语音饱和检测器将所述语音信号周期划分为多个周期,并且当每个周期中的语音信号的值大于语音输入分辨率时,确定所述语音信号周期中的语音信号饱和。8.根据权利要求3所述的系统,其中所述输入等级确定器在所述语音检测器不能检测所述语音信号周期时确定新语音输入等级。9.根据权利要求8所述的系统,其中所述输入等级确定器在所述语音检测器不能检测所述语音信号周期时,确定所述新语音输入等级MicNEW为...

【专利技术属性】
技术研发人员:郑明基沈贤植李钟昌金光春
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1