语音识别方法及装置制造方法及图纸

技术编号:16217914 阅读:33 留言:0更新日期:2017-09-16 00:16
本发明专利技术实施例提供一种语音识别方法及装置,其中,方法包括以下步骤:响应于用户在语音识别客户端的音频输入界面上输入音频信息的操作,获取预先根据所述语音识别客户端与在线语音识别引擎之间的网络状况确定的语音识别引擎指示信息;发送所述音频信息至所述语音识别引擎指示信息所指示的语音识别引擎,以通过所述语音识别引擎指示信息所指示的语音识别引擎识别所述音频信息。本发明专利技术实施例提供的语音识别方法及装置可以提高语音识别的实时性,减少时间的浪费。

Speech recognition method and apparatus

The embodiment of the invention provides a device and a method of speech recognition, the method comprises the following steps: in response to a user input audio interface in speech recognition client input audio information, obtain in advance according to the speech recognition engine is determined between the client and the online speech recognition speech recognition engine network status information indicating voice; the recognition engine sends the audio information to the speech recognition engine indication information, the speech recognition engine by the speech recognition engine indication information of the audio information. The method and the device provided by the embodiment of the invention can improve the real-time performance of the speech recognition and reduce the waste of time.

【技术实现步骤摘要】
语音识别方法及装置
本申请涉及语音识别
,尤其涉及一种语音识别方法及装置。
技术介绍
随着语音识别技术的发展,出现了可以将音频转换成文字的语音识别引擎。其中,语音合成引擎包括在线语音识别引擎和离线语音识别引擎。现有技术中,为了在不同网络状况下都能顺利进行语音识别,出现了综合使用在线语音识别引擎和离线语音识别引擎进行语音识别的方法。具体为:在用户输入音频信息后,客户端将用户输入的音频信息同时发送至离线语音识别引擎和在线语音识别引擎。在预定时间内,若客户端接收到在线语音识别引擎返回的文字信息,则使用在线语音识别引擎进行语音识别;否则,使用离线语音识别引擎进行语音识别。上述语音识别方法中,在用户输入音频信息后,需要等待预定时间,才能确定所使用的语音合成引擎,导致语音识别的实时性较差。
技术实现思路
本申请的多个方面提供一种语音识别方法及装置,用以提高语音识别的实时性。本申请实施例提供一种语音识别方法,包括:响应于用户在语音识别客户端的音频输入界面上输入音频信息的操作,获取预先根据所述语音识别客户端与在线语音识别引擎之间的网络状况确定的语音识别引擎指示信息;发送所述音频信息至所述语音识别引擎指示信息所指示的语音识别引擎,以通过所述语音识别引擎指示信息所指示的语音识别引擎识别所述音频信息。可选地,在响应于用户在语音识别客户端的音频输入界面上输入音频信息的操作之前,所述方法还包括:响应于进入所述音频输入界面或者开启所述语音识别客户端的操作,侦测所述语音识别客户端与所述在线语音识别引擎之间的网络状况;根据侦测到所述语音识别客户端与所述在线语音识别引擎之间的网络状况,确定所述语音识别引擎指示信息。可选地,在响应于进入所述音频输入界面或者开启所述语音识别客户端的操作之前,所述方法还包括:响应于所述用户的侦测配置请求,展示网络设置界面,以供所述用户配置侦测周期以及侦测网址;响应于所述用户在所述网络设置界面上的设置操作,获取所述用户配置的所述侦测周期以及所述侦测网址。可选地,响应于进入所述音频输入界面或者开启所述语音识别客户端的操作,侦测所述语音识别客户端与所述在线语音识别引擎之间的网络状况,包括:响应于进入所述音频输入界面或者开启所述语音识别客户端的操作,按照所述侦测周期,周期性地向所述侦测网址对应的所述在线语音识别引擎发送侦测请求;根据所述在线语音识别引擎对所述侦测请求的响应情况,确定所述语音识别客户端与所述在线语音识别引擎之间的网络状况。可选地,根据侦测到所述语音识别客户端与所述在线语音识别引擎之间的网络状况,确定所述语音识别引擎指示信息,包括:若所述语音识别客户端与所述在线语音识别引擎之间的网络状况满足设定的网络要求,确定指示所述在线语音识别引擎的语音识别引擎指示信息;若所述语音识别客户端与所述在线语音识别引擎之间的网络状况不满足设定的网络要求,确定指示离线语音识别引擎的语音识别引擎指示信息。可选地,在根据侦测到所述语音识别客户端与所述在线语音识别引擎之间的网络状况,确定所述语音识别引擎指示信息之后,所述方法还包括:保存所述语音识别引擎指示信息至本地内存;所述响应于用户在语音识别客户端提供的音频输入界面上输入音频信息的操作,获取预先根据所述语音识别客户端与在线语音识别引擎之间的网络状况确定的语音识别引擎指示信息,包括:响应于所述用户在所述音频输入界面上输入音频信息的操作,从所述本地内存,获取最近一次保存的所述语音识别引擎指示信息。可选地,所述方法还包括:在所述语音识别引擎指示信息所指示的语音识别引擎识别所述音频信息的过程中,侦测所述语音识别客户端与在线语音识别引擎之间的网络状况;当所述语音识别客户端与在线语音识别引擎之间的网络状况发生变化时,更新所述语音识别引擎指示信息。可选地,所述方法还包括:响应于退出所述音频输入界面或关闭所述语音识别客户端的操作,停止侦测所述语音识别客户端与在线语音识别引擎之间的网络状况。本申请实施例还提供一种语音识别装置,包括:第一获取模块,用于响应于用户在语音识别客户端的音频输入界面上输入音频信息的操作,获取预先根据所述语音识别客户端与在线语音识别引擎之间的网络状况确定的语音识别引擎指示信息;发送模块,用于发送所述音频信息至所述语音识别引擎指示信息所指示的语音识别引擎,以通过所述语音识别引擎指示信息所指示的语音识别引擎识别所述音频信息。可选地,所述装置还包括:侦测模块,用于响应于进入所述音频输入界面或者开启所述语音识别客户端的操作,侦测所述语音识别客户端与所述在线语音识别引擎之间的网络状况;确定模块,用于根据侦测到所述语音识别客户端与所述在线语音识别引擎之间的网络状况,确定所述语音识别引擎指示信息。在本申请实施例中,在用户执行输入音频信息的操作之前,预先根据网络状况确定语音识别引擎指示信息;进而在用户执行输入音频信息的操作时,可以立即获取到语音识别引擎指示信息,并确定可用的语音识别引擎;进一步可以在用户输入音频信息之后,立即通过确定的语音识别引擎进行语音识别,从而提高了语音识别的实时性,减少时间的浪费。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请一实施例提供的语音识别方法的流程示意图;图2为本申请又一实施例提供的语音识别方法的流程示意图;图3为本申请又一实施例提供的语音识别装置的模块结构图;图4为本申请又一实施例提供的语音识别装置的模块结构图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。以下结合附图,详细说明本申请各实施例提供的技术方案。图1为本申请一实施例提供的语音识别方法的流程示意图。如图1所示,该方法包括以下步骤:S101:响应于用户在语音识别客户端的音频输入界面上输入音频信息的操作,获取预先根据语音识别客户端与在线语音识别引擎之间的网络状况确定的语音识别引擎指示信息。S102:发送音频信息至语音识别引擎指示信息所指示的语音识别引擎,以通过语音识别引擎指示信息所指示的语音识别引擎识别音频信息。当用户有音频识别的需求时,可以将待识别的音频信息输入至语音识别客户端,再由语音识别客户端将接收到的音频信息发送至语音识别引擎进行语音识别。对于语音识别客户端来说,一般会提供一音频输入界面,用户可以在音频输入界面上执行输入音频信息的操作。可选地,在音频输入界面上可以设置一音频输入控件,用户可以通过触发音频输入控件,执行音频信息的输入。例如,音频输入控件可以为麦克风图标控件,用户可以通过触控麦克风图标控件,输入音频信息。接着,为了在用户输入音频信息后,能够立即确定语音识别引擎,本实施例预先确定出语音识别引擎指示信息,进而可响应于用户在音频输入界面上输入音频信息的操作,获取预先确定的语音识别引擎指示信息,从而基于该语音识别引擎指示信息确定用于对用户输入的音频信息进行语音识别的语音识别引擎。其中,语音识别引本文档来自技高网...
语音识别方法及装置

【技术保护点】
一种语音识别方法,其特征在于,包括:响应于用户在语音识别客户端的音频输入界面上输入音频信息的操作,获取预先根据所述语音识别客户端与在线语音识别引擎之间的网络状况确定的语音识别引擎指示信息;发送所述音频信息至所述语音识别引擎指示信息所指示的语音识别引擎,以通过所述语音识别引擎指示信息所指示的语音识别引擎识别所述音频信息。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:响应于用户在语音识别客户端的音频输入界面上输入音频信息的操作,获取预先根据所述语音识别客户端与在线语音识别引擎之间的网络状况确定的语音识别引擎指示信息;发送所述音频信息至所述语音识别引擎指示信息所指示的语音识别引擎,以通过所述语音识别引擎指示信息所指示的语音识别引擎识别所述音频信息。2.根据权利要求1所述的方法,其特征在于,在响应于用户在语音识别客户端的音频输入界面上输入音频信息的操作之前,所述方法还包括:响应于进入所述音频输入界面或者开启所述语音识别客户端的操作,侦测所述语音识别客户端与所述在线语音识别引擎之间的网络状况;根据侦测到所述语音识别客户端与所述在线语音识别引擎之间的网络状况,确定所述语音识别引擎指示信息。3.根据权利要求2所述的方法,其特征在于,在响应于进入所述音频输入界面或者开启所述语音识别客户端的操作之前,所述方法还包括:响应于所述用户的侦测配置请求,展示网络设置界面,以供所述用户配置侦测周期以及侦测网址;响应于所述用户在所述网络设置界面上的设置操作,获取所述用户配置的所述侦测周期以及所述侦测网址。4.根据权利要求3所述的方法,其特征在于,响应于进入所述音频输入界面或者开启所述语音识别客户端的操作,侦测所述语音识别客户端与所述在线语音识别引擎之间的网络状况,包括:响应于进入所述音频输入界面或者开启所述语音识别客户端的操作,按照所述侦测周期,周期性地向所述侦测网址对应的所述在线语音识别引擎发送侦测请求;根据所述在线语音识别引擎对所述侦测请求的响应情况,确定所述语音识别客户端与所述在线语音识别引擎之间的网络状况。5.根据权利要求4所述的方法,其特征在于,根据侦测到所述语音识别客户端与所述在线语音识别引擎之间的网络状况,确定所述语音识别引擎指示信息,包括:若所述语音识别客户端与所述在线语音识别引擎之间的网络状况满足设定的网络要求,确定指示所述在线语音识别引擎的语音识别引擎指示信息;若所述语音识别客户端与所述在线语音识...

【专利技术属性】
技术研发人员:蒋化冰蔡汉嘉张海建谭舟王振超梁兰徐志强严婷郦莉
申请(专利权)人:上海木爷机器人技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1