语音识别方法及装置制造方法及图纸

技术编号:17009782 阅读:51 留言:0更新日期:2018-01-11 06:01
本发明专利技术提供了一种语音识别方法,包括:获取用户发送的语音指令;将所述语音指令的音频流发送给本地识别引擎;接收所述本地识别引擎返回的本地识别结果;当本地识别结果不在预设范围内时,将所述语音指令的音频流发送给云端识别引擎;接收所述云端识别引擎返回的云端识别结果;当云端识别结果在预设范围内时,执行所述语音指令。本发明专利技术还提供了一种语音识别装置。该方法具备响应速度快和控制简单,保证语音指令能够有效识别同时节省网络流量。

【技术实现步骤摘要】
语音识别方法及装置
本专利技术属于语音识别
,具体涉及语音识别方法及装置。
技术介绍
随着语音识别设备的广泛使用,如何高效提高语音识别的准确率变得日趋重要,目前的语音识别有两类方式,一类是云端在线识别,用户使用时可以随意讲话,由产品设备采集到用户讲话内容,通过通讯模组上传到云端服务器进行语义分析理解,解析出用户的用意,再通过网络传到产品设备中进行相应的操作控制,这种方式优点在于用户可自由讲话,比较接近人们的日常生活习惯,但缺点在于需要网络才能使用,一旦网络环境不佳,将产生无法识别或者反馈延时的状况;另一类是本地识别,该方式通过本地识别模组进行的本地语音控制命令词的识别,该类方式无需使用网络,具有响应速度快,控制简单等优点,但需要事先设定好语音控制命令词,产品设备需识别到完整的语音控制命令词后才会响应,无法实现自由对讲,体验感不高。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种语音识别方法及装置,用于克服现有技术中的缺点。具体的,本专利技术提出了以下具体的实施例:本专利技术实施例提供了一种语音识别方法,包括:获取用户发送的语音指令;将所述语音指令的音频流发送给本地识别引擎;接收所述本地识别引擎返回的本地识别结果;当本地识别结果不在预设范围内时,将所述语音指令的音频流发送给云端识别引擎;接收所述云端识别引擎返回的云端识别结果;当云端识别结果在预设范围内时,执行所述语音指令。作为上述技术方案的进一步改进,所述本地识别结果不在预设范围内具体为:所述本地识别结果对应的置信度小于第一预设置信度区间上限;所述云端识别结果在预设范围内具体为:所述云端识别结果对应的置信度大于第二预设置信度区间上限。作为上述技术方案的进一步改进,所述方法还包括:循环执行所述将所述语音指令发送给云端识别引擎,直至所述云端识别引擎返回的云端识别结果在预设范围内或者重发次数达到最大发送次数。作为上述技术方案的进一步改进,所述方法还包括:在初始化和/或根据用户输入,设置所述最大发送次数。作为上述技术方案的进一步改进,所述方法还包括:接收到用户发送的语音指令后,开启所述本地识别引擎,当本地识别结果不在预设范围内时,开启所述云端识别引擎。本专利技术实施例还提供了一种语音识别装置,包括:语音获取模块,用于获取用户发送的语音指令;第一发送模块,用于将所述语音指令的音频流发送给本地识别引擎;第一接收模块,用于接收所述本地识别引擎返回的本地识别结果;第一判断模块,用于判断所述本地识别结果是否在预设范围内,当本地识别结果在预设范围内时,执行所述语音指令,当本地识别结果不在预设范围内时,执行云端识别;第二发送模块,用于所述第一判断模块判断本地识别结果不在预设范围内时将所述语音指令的音频流发送给云端识别引擎;第二接收模块,用于接收所述云端识别引擎返回的云端识别结果;第二判断模块,用于判断所述云端识别结果是否在预设范围内,当云端识别结果在预设范围内时,执行所述语音指令,当云端识别结果不在预设范围内时,则发出无效指令提示;执行模块,用于执行所述语音指令。作为上述技术方案的进一步改进,所述第一判断模块判定本地识别结果不在预设范围内的依据具体为:所述本地识别结果对应的置信度小于第一预设置信度区间上限;所述第二判断模块判定云端识别结果在预设范围内的依据具体为:所述云端识别结果对应的置信度大于第二预设置信度区间上限。作为上述技术方案的进一步改进,还包括重发模块,用于循环执行所述将所述语音指令发送给云端识别引擎,直至所述云端识别引擎返回的云端识别结果在预设范围内或者重发次数达到最大发送次数。作为上述技术方案的进一步改进,还包括设置模块,用于在初始化和/或根据用户输入,设置所述最大发送次数。作为上述技术方案的进一步改进,还包括触发模块,用于在接收到用户发送的语音指令后,开启所述本地识别引擎,当本地识别结果不在预设范围内时,开启所述云端识别引擎。采用本专利技术提供的技术方案,与已有的公知技术相比,至少具有如下有益效果:响应速度快和控制简单。本地识别不成功后将所述语音指令上送云端进行识别,消耗的网络数据流量比每次上送云端识别更加节省流量。保证语音指令能够有效识别。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术一实施例提出的一种语音识别方法的流程示意图。图2为本专利技术另一实施例提出的一种语音识别方法的流程示意图。图3为本专利技术实施例提出的一种语音识别装置的结构示意图。主要元件符号说明:101-语音获取模块;102-第一发送模块;103-第一接收模块;104-第一判断模块;105-第二发送模块;106-第二接收模块;107-第二判断模块;108-执行模块。具体实施方式在下文中,将更全面地描述本公开的各种实施例。本公开可具有各种实施例,并且可在其中做出调整和改变。然而,应理解:不存在将本公开保护范围限于在此公开的特定实施例的意图,而是应将本公开理解为涵盖落入本公开的各种实施例的精神和范围内的所有调整、等同物和/或可选方案。在下文中,可在本公开的各种实施例中使用的术语“包括”或“可包括”指示所公开的功能、操作或元件的存在,并且不限制一个或更多个功能、操作或元件的增加。此外,如在本公开的各种实施例中所使用,术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。在本公开的各种实施例中使用的表述(诸如“第一”、“第二”等)可修饰在各种实施例中的各种组成元件,不过可不限制相应组成元件。例如,以上表述并不限制所述元件的顺序和/或重要性。以上表述仅用于将一个元件与其它元件区别开的目的。例如,第一用户设备和第二用户设备指示不同用户设备,尽管二者都是用户设备。例如,在不脱离本公开的各种实施例的范围的情况下,第一元件可被称为第二元件,同样地,第二元件也可被称为第一元件。应注意到:如果描述将一个组成元件“连接”到另一组成元件,则可将第一组成元件直接连接到第二组成元件,并且可在第一组成元件和第二组成元件之间“连接”第三组成元件。相反地,当将一个组成元件“直接连接”到另一组成元件时,可理解为在第一组成元件和第二组成元件之间不存在第三组成元件。在本公开的各种实施例中使用的术语仅用于描述特定实施例的目的并且并非意在限制本公开的各种实施例。除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本公开的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关
中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本公开的各种实施例中被清楚地限定。实施例1如图1所示,本专利技术实施例提供了一种语音识别方法,包括:S01、获取用户发送的语音指令。S02、将所述语音指令的音频流发送本文档来自技高网
...
语音识别方法及装置

【技术保护点】
一种语音识别方法,其特征在于,该方法包括:获取用户发送的语音指令;将所述语音指令的音频流发送给本地识别引擎;接收所述本地识别引擎返回的本地识别结果;当本地识别结果不在预设范围内时,将所述语音指令的音频流发送给云端识别引擎;接收所述云端识别引擎返回的云端识别结果;当云端识别结果在预设范围内时,执行所述语音指令。

【技术特征摘要】
1.一种语音识别方法,其特征在于,该方法包括:获取用户发送的语音指令;将所述语音指令的音频流发送给本地识别引擎;接收所述本地识别引擎返回的本地识别结果;当本地识别结果不在预设范围内时,将所述语音指令的音频流发送给云端识别引擎;接收所述云端识别引擎返回的云端识别结果;当云端识别结果在预设范围内时,执行所述语音指令。2.根据权利要求1所述的语音识别方法,其特征在于,所述本地识别结果不在预设范围内具体为:所述本地识别结果对应的置信度小于第一预设置信度区间上限;所述云端识别结果在预设范围内具体为:所述云端识别结果对应的置信度大于第二预设置信度区间上限。3.根据权利要求1所述的语音识别方法,其特征在于,所述方法还包括:循环执行所述将所述语音指令发送给云端识别引擎,直至所述云端识别引擎返回的云端识别结果在预设范围内或者重发次数达到最大发送次数。4.根据权利要求3所述的语音识别方法,其特征在于,所述方法还包括:在初始化和/或根据用户输入,设置所述最大发送次数。5.根据权利要求1-4任一项所述的语音识别方法,其特征在于,所述方法还包括:接收到用户发送的语音指令后,开启所述本地识别引擎,当本地识别结果不在预设范围内时,开启所述云端识别引擎。6.一种语音识别装置,其特征在于,包括:语音获取模块,用于获取用户发送的语音指令;第一发送模块,用于将所述语音指令的音频流发送给本地识别引擎;第一接收模块,用于接收所述本地识别引擎返回的本地识别结果;第一判断模块,用于判断所...

【专利技术属性】
技术研发人员:李明张勇
申请(专利权)人:深圳北鱼信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1