语音识别方法及设备技术

技术编号:14744763 阅读:62 留言:0更新日期:2017-03-01 20:45
本发明专利技术公开了一种语音识别方法,所述方法包括:采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;在收到网络异常信息时,启动重试等待;在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。本发明专利技术还同时公开了一种语音识别设备。

【技术实现步骤摘要】

本专利技术涉及移动终端语音识别
,特别涉及一种语音识别方法及设备
技术介绍
由于移动终端的计算和存储能力相对较弱,而语音识别的计算量较大且需要较大的空间来存储语音库,故现有的语音识别方案,比如:AppleSiri、GoogleNow等,均是在云端进行语音识别,移动终端只负责语音指令的采集和传输。为尽量降低反应延迟,现有技术不等待用户发出全部语音指令,而是在用户刚发出语音指令的同时,便将采集到的音频流直接传输到云端服务器,由云端服务器直接对音频流进行处理和识别。采用现有技术的方案,在进行语音识别过程中需要保持终端的网络连接,但实际情况中,由于移动终端经常会随用户快速移动,时常会出现网络连接不佳的情况,比如:行车过程中、终端切换信号基站、通过隧道、超出WIFI范围和WIFI路由重启等,这都会影响语音识别的成功率。现有技术直接将音频流实时传输到云端服务器,一旦网络异常,移动终端本地和云端服务器均没有完整的音频数据,只能向用户汇报网络异常,如:网络掉线时报网络错误;网速慢等导致长时间收不到服务器响应时报网络超时等,由用户根据异常情况,在排除异常后重新发出语音指令来再次识别。故现有技术的语音识别失败率较高,且需要用户人工干预来重新识别,识别效率低,用户体验不佳。
技术实现思路
为解决现有存在的技术问题,本专利技术实施例期望提供一种语音识别方法及设备,以提高云端语音识别效率,增强用户体验。本专利技术实施例的技术方案是这样实现的:在本专利技术实施例的一方面,提供了一种语音识别方法,包括:采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;在收到网络异常信息时,启动重试等待;在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。优选地,所述方法还包括:循环执行所述重试等待和所述再次发送,直至所述云端服务器识别成功或者达到最大重试次数。优选地,所述方法还包括:所述网络异常信息由所述云端服务器返回,或者在超出预定时间仍未收到所述云端服务器的响应时自动产生。优选地,所述方法还包括:在识别成功或达到最大重试次数后删除本地记录的所述音频流数据。优选地,所述方法还包括:在初始化时和/或根据用户输入,设置最大重试次数以及各次重试等待时间。在本专利技术实施例的另一方面,还提供一种语音识别设备,包括:音频采集模块,用于采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;重试等待模块,用于在收到网络异常信息时,启动重试等待;重试处理模块,用于在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。优选地,所述设备还包括:循环执行模块,用于循环执行所述重试等待模块和所述重试处理模块,直至所述云端服务器识别成功或者达到最大重试次数。优选地,所述设备还包括:异常识别模块,用于识别由所述云端服务器返回的所述网络异常信息,或者在超出预定时间仍未收到所述云端服务器的响应时自动产生所述网络异常信息。优选地,所述设备还包括:数据清理模块,用于在识别成功或达到最大重试次数后删除本地记录的所述音频流数据。优选地,所述设备还包括:设置模块,用于在初始化时和/或根据用户输入,设置最大重试次数以及各次重试等待时间。本专利技术实施例期望提供的语音识别方法及设备,通过本地存储数据自动进行异常后的重试处理,无需用户的干预即可反复进行重试处理,确保云端语音识别的顺利进行,可大幅提高网络连接不理想时云端语音识别的成功率,避免用户重复输入语音指令,提高了语音识别效率,提升用户体验。附图说明图1为本专利技术的一个实施例中语音识别方法的流程示意图;图2为本专利技术的另一个实施例中语音识别设备的模块结构示意图。具体实施方式为在网络连接不理想时确保云端语音识别的成功率,避免用户重复输入语音指令,如图1所示,本专利技术实施例提供了一种语音识别方法,包括:S1:采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;S2:在收到网络异常信息时,启动重试等待;S3:在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。其中,本专利技术实施例中的网络环境为数据链路、WIFI以及其它的无线网络环境,所述网络异常信息包括但不限于网络掉线时的网络错误信息、网速慢等导致长时间收不到服务器响应时的网络超时信息等。上述步骤S2中,所述网络异常信息由云端服务器返回,或在超出预定时间仍未收到云端服务器的响应时自动产生。上述步骤S3中,所述重试条件包括:排除网络异常情况和/或达到重试等待时间。更进一步地,本专利技术实施例的方法中,进行重试的步骤S2和S3重复执行,直到云端识别成功或者达到重试次数的上限。其中,最大重试次数以及每次重试等待时间的间隔可在语音识别初始化时设置或由用户动态调整。本专利技术实施例通过重试机制提高云端语音识别效率,语音指令以音频流方式直接发送到云端进行识别的同时,本地也记录完整音频流数据的至少一份拷贝,音频流数据可采用本地录音文件数据、内存数据等保存方式;为合理控制本地存储空间,在识别成功或达到最大重试次数后删除本地保存的音频流数据。最大重试次数N以及每次重试的等待时间可以预先设置。其中,各次重试等待时间可以相同,也可以分别设置为不同的值,比如:第i次重试的等待时间Ti可以逐一设置,也可以按一定变化规律(递增、递减、先增后减、先减后增等等)自动设置;所述变化规律可以采用预设函数来表示也可是随机序列。此外,最大重试次数及重试等待时间也可由用户随时更改调整。语音识别主要应用于用户不便用手直接操作终端设备的情况,比如驾驶期间,在将语音指令的音频流发送到云端之后,等待云端识别的结果,若云端返回识别后的操作指令,则按所述操作指令控制终端设备,本次语音识别结束。若未收到识别后的操作指令而是第i次返回网络异常信息,则启动第i次重试等待,按预设的等待时间Ti进行计时。在到达等待时间Ti时,或者网络异常情况被排除时,比如发现可用网络并建立连接后,将本地保存的音频流数据再次发送给云端服务器进行识别。若返回网络异常信息的次数i大于预设的最大重试次数N,则返回识别失败信息并结束本次语音识别。如图2所示,本专利技术实施例还同时提供了一种语音识别设备1,与云端服务器2进行交互,所述语音识别设备1包括:音频采集模块101,用于采集语音指令,将所述语音指令的音频流发送到云端服务器2进行识别的同时,在本地记录所述音频流数据;重试等待模块102,用于在收到网络异常信息时,启动重试等待;重试处理模块103,用于在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器2。在本专利技术优选实施例中,重试可重复多次循环执行,故所述语音识别设备1还包括:循环执行模块,用于循环执行所述重试等待模块和所述重试处理模块,直至所述云端服务器识别成功或者达到最大重试次数。异常信息由云端服务器返回或本地产生,所述语音识别设备1还包括:异常识别模块,用于识别由所述云端服务器返回的所述网络异常信息,或者在超出预定时间仍未收到所述云端服务器的响应时自动产生所述网络异常信息。优选地,所述语音识别设备1还包括:数据清理模块,用于在识别成功或达到最大重试次数后删除本地记录的所述音频流数据。以本文档来自技高网...
语音识别方法及设备

【技术保护点】
一种语音识别方法,其特征在于,所述方法包括:采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;在收到网络异常信息时,启动重试等待;在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:采集语音指令,将所述语音指令的音频流发送到云端服务器进行识别的同时,在本地记录所述音频流数据;在收到网络异常信息时,启动重试等待;在满足重试条件时,将本地记录的所述音频流数据再次发送到所述云端服务器。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:循环执行所述重试等待和所述再次发送,直至所述云端服务器识别成功或者达到最大重试次数。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述网络异常信息由所述云端服务器返回,或者在超出预定时间仍未收到所述云端服务器的响应时自动产生。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:在识别成功或达到最大重试次数后删除本地记录的所述音频流数据。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:在初始化时和/或根据用户输入,设置最大重试次数以及各次重试等待时间。6.一种语音识别设备,其特征在于,所述设备包括:音频采集模块,用于采集语音指...

【专利技术属性】
技术研发人员:赵永
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1