一种语音识别方法及装置制造方法及图纸

技术编号:3928940 阅读:247 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种语音识别方法及装置,技术方案中该方法包括:通过至少两条语音识别支路识别输入语音;在确定从所述语音识别支路获得的至少两种语音识别结果一致时,输出所述识别结果。本发明专利技术实施例还提供了一种语音识别装置,其中包括用于通过至少两条语音识别支路识别输入语音的信息识别模块,以及用于在确定从所述信息识别模块中获得的至少两种语音识别结果一致时,输出所述识别结果的识别处理模块。采用本发明专利技术实施例记载的技术方案能够提高现有语音识别系统的用户体验。

【技术实现步骤摘要】

本专利技术涉及通信
,具体的说,涉及一种语音识别方法及装置
技术介绍
自动语音识别ASR(Automatic Speech Recognition)技术是一种将人的语音转换 为文本的技术,属于一个多学科交叉的
,它与声学、语音学、语言学、数字信号处理 理论、信息论、计算机科学等众多学科紧密相连 。近年来,消费类电子产品对低成本、高稳健 性的语音识别系统的需求逐渐增加,语音识别系统已经大量地从实验室的PC平台转移到 了终端设备中。目前已经有许多用户有机会体验到语音识别技术带给人们的便捷服务,例 如通过语音识别技术,用户可以直接发出语音来对终端设备发送指令,或要求终端设备记 录用户发出的语音,从而将文本转换成用户语音朗读出来。终端语音识别是一个模式识别匹配的过程。在这个过程中,终端首先要根据人的 语音特点建立语音模型,通过对输入的语音信号的分析,抽取所需的特征,来建立语音识别 所需的模板。而终端在识别过程中要根据语音识别模型,将终端中的语音模板与输入的语 音信号的特征比较后,确定与输入语音匹配的最佳模板,从而获得语音识别的结果。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题在现有的语音识别终端产品中,语音识别系统对用户输入的语音进行识别过程 中,通常会根据可信度的高低向用户显示与输入语音有关的几种选择,用户需要再次选择 来确定最终的识别结果;另外,语音识别过程中如果出现错误,只能在提示用户识别结果或 根据该识别结果继续运行程序时,被用户发觉,无法提前获知。例如用户在使用语音识别 技术拨打电话时,当语音识别错误发生时,往往在接通电话后,用户才能发现通话对象是错 误的。针对上述现有技术可以看出,现有的语音识别系统很大程度上给用户造成的用户体 验很差。
技术实现思路
本专利技术的实施例提供了一种语音识别方法及装置,能够提高现有语音识别系统的 用户体验。本专利技术实施例提供了一种语音识别方法,技术方案包括通过至少两条语音识别支路识别输入语音;在确定从所述语音识别支路获得的至少两种语音识别结果一致时,输出所述识别结果。本专利技术实施例提供了一种语音识别装置,技术方案包括 信息识别模块,用于通过至少两条语音识别支路识别输入语音;识别处理模块,用于在确定从所述信息识别模块中获得的至少两种语音识别结果 一致时,输出所述识别结果。由上述本专利技术的实施例提供的技术方案可以看出,其通过对至少两条语音识别支路产生的结果进行判决,不需要用户再次对识别结果进行选择,在错误发生时可以采用相应的处理方式提示用户,提高了现有语音识别系统的用户体验。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用 的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本 领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他 的附图。图1为本专利技术实施例一种语音识别方法的流程图;图2为本专利技术实施例一种语音识别方法的应用场景图;图3为本专利技术实施例一种语音识别方法的应用场景图;图4为本专利技术实施例一种语音识别装置的结构示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于 本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本专利技术保护的范围。本专利技术实施例一种语音识别方法及装置的核心是针对输入语音采用至少两条的 语音识别支路进行处理,通过对产生的至少两个语音识别结果进行判决后输出,用户不需 要针对多个识别结果进行再次选择,同时,本专利技术实施例在识别结果的判决过程中,能够及 时提示用户识别过程中出现的错误,避免了由于语音识别错误导致的错误程序的运行。下面通过本专利技术具体实施例针对本专利技术记载的技术方案进行详细说明。如图1所示,本专利技术实施例提供了一种语音识别方法,可以通过如下技术方案实 现步骤101 通过至少两条语音识别支路识别输入语音;步骤102 在确定从所述语音识别支路获得的至少两种语音识别结果一致时,输 出所述识别结果。在本专利技术的一个实施例中,通过至少两条语音识别支路识别输入语音的过程具体 可以通过如下技术方案实现步骤1011 获取输入语音信号;步骤1012 分别通过至少两条语音识别支路对所述语音信号进行识别后,存储所 述语音识别支路产生的至少两种语音识别结果。需要说明的是,本专利技术实施例中采用至少两条语音识别支路对用户输入的语音信 号进行语音识别,并没有具体限定语音识别支路的数量,在实施例的具体实现场景中,可以 根据业务需求来具体选配。另外需要说明的是,在现有的语音识别系统中常用的算法通常有基于神经网络 的训练和识别算法、基于动态时间归整匹配的识别算法和基于统计的隐含马尔可夫模型识 别和训练算法。由于基于神经网络的训练和识别算法实现起来较复杂,且识别率不高。基于动态 时间归整匹配的识别算法属于一个最为小巧的语音识别的算法,其系统开销小,且识别速 度快,针对小词汇量的语音命令控制系统非常有效,但不适用在复杂系统中。基于统计的隐含马尔可夫模型识别和训练算法是目前语音识别系统中最佳的一 种,因为这种数学模型已经形成了完整的理论框架。隐含马尔可夫模型的算法是通过将语 音看成一连串特定状态,这种状态以某种隐含的关系与语音的观测量(或特征)相关联,并 且这种隐含关系在HMM模型中通常以概率形式所体现,HMM模型的输出结果也以概率形式 给出,这为本专利技术实施例中的判决过程创造了条件。由此,本专利技术实施例中语音识别支路优 选基于统计的隐含马尔可夫模型识别和训练算法来实现。在本专利技术实施例中,在确定从所述语音识别支路获得的至少两种语音识别结果不 一致时,分别给出了两种不同的处理方式一种处理方式的应用场景如图2所示用户输入的语音信号通过至少两个语音识别支路进行语音识别,获得至少两种语 音识别结果;通过对至少两种语音识别结果判决后如果相同,将识别结果直接输出,或者根据该识别结果进行相应的操作;比如用 户在使用语音拨号服务时,系统会根据获得的相同识别结果确定用户拨出的被叫号码,向 被叫号码发出通话呼叫或进行短信发送。相反,当获得的识别结果中至少有一个识别结果不同时,输出警报,提示用户重新 输入语音信息,以便针对再次输出的语音信息进行识别。用户使用现有的语音识别系统提 供的服务时,当识别结果有误,例如用户使用语音拨号时,只能在系统根据错误识别结果 拨通被叫号码后,用户才发觉其的错误操作,不仅导致用户自身的体验很差,同时也影响了 被叫用户的体验,通过在错误发生时,及时提示用户语音识别过程出现错误,避免误操作的 产生。需要说明的是,在图2所示的应用场景中,判决过程不具体针对语音识别支路的 数量进行考虑,判决过程中只要有语音识别支路产生的识别结果有一个与其余结果不同 时,即做出警报。采用上述图2这种方式,不仅能够避免用户针对多个识别结果的再次选择带来的 麻烦,而且在语音信息识别过程出现错误时,能够及时给出用户提示,避免识别错误带来的 误操作。另一种处理方式的应用场景图如图3所示用户输入的语音信号通过至少两个语音识别支路进行语音识别,获得至少两种语 音识本文档来自技高网
...

【技术保护点】
一种语音识别方法,其特征在于,包括:通过至少两条语音识别支路识别输入语音;在确定从所述语音识别支路获得的至少两种语音识别结果一致时,输出所述识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:汪海
申请(专利权)人:华为终端有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1