一种语音处理方法、装置及存储介质制造方法及图纸

技术编号:26422506 阅读:12 留言:0更新日期:2020-11-20 14:18
本公开是关于一种语音处理方法、装置及存储介质。该方法应用于电子设备,所述方法包括:采集音频数据,获取云服务器基于所述音频数据得到的第一语音识别结果;根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测。本公开实施例中,在采集到音频数据之后,能够获取云服务器基于音频数据得到的第一语音识别结果,并根据第一语音识别结果确定是否进行音频数据的语音端点检测。通过云服务器的语音识别技术辅助电子设备对音频数据的语音端点进行检测,能够使得检测精确度更高,减少由于环境噪声引起的误判停,进而提高语音交互的成功率,进而提高用户体验感。

【技术实现步骤摘要】
一种语音处理方法、装置及存储介质
本公开涉及语音信息
,尤其涉及一种语音处理方法、装置及存储介质。
技术介绍
目前,通过语音进行人机交互的交互方式受到了广泛关注,整个互联网行业都在积极探索语音交互可能的应用方式和应用场景,且已经有大量基于语音交互的电子设备面世,如智能音箱等。相关技术中,电子设备在采集到音频数据之后,会直接对采集到的音频数据进行端点检测,以对采集到的音频数据进行判停,同时将音频数据发送至云服务器进行语音识别。但是,由于环境噪声的存在,电子设备容易发生误判停,会导致音频数据不能发送至云服务器或者只有部分发送至云服务器,进而导致语音交互失败。
技术实现思路
本公开提供一种语音处理方法、装置及存储介质。根据本公开实施例的第一方面,提供一种语音处理方法,应用于电子设备,所述方法包括:采集音频数据,获取云服务器基于所述音频数据得到的第一语音识别结果;根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测。可选的,所述获取基于所述音频数据得到的第一语音识别结果,包括:发送所述音频数据至云服务器;接收所述云服务器反馈的基于自动语音识别技术ASR对所述音频数据进行处理得到的所述第一语音识别结果。可选的,在所述获取基于所述音频数据得到的第一语音识别结果之前,所述方法还包括:检测所述音频数据中是否包含唤醒信息;如果所述音频数据中包含所述唤醒信息,则确定所述电子设备处于唤醒状态。可选的,所述第一语音识别结果包含与所述音频数据对应的内容长度;所述根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测,包括:在第一预设时间内,当所述内容长度大于预设长度阈值时,确定开始进行所述音频数据的语音端点检测。可选的,所述方法还包括:如果在所述第一预设时间内未获取到所述第一语音识别结果,则确定不进行所述音频数据的语音端点检测。可选的,所述方法还包括:当确定进行所述音频数据的所述语音端点检测后,获取云服务器基于所述音频数据得到的第二语音识别结果;确定获取到第一第一语音识别结果的第一时刻与获取到第二第一语音识别结果的第二时刻之间的时间间隔;当所述时间间隔大于或等于第二预设时间时,确定结束所述音频数据的语音端点检测。可选的,所述方法还包括:接收云服务器根据所述第一语音识别结果反馈的唤醒响应信息;输出所述唤醒响应信息。根据本公开实施例的第二方面,提供一种语音处理装置,应用于电子设备,所述装置包括:第一获取模块,配置为采集音频数据,获取云服务器基于所述音频数据得到的第一语音识别结果;第一确定模块,配置为根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测。可选的,所述第一获取模块,还配置为:发送所述音频数据至云服务器;接收所述云服务器反馈的基于自动语音识别技术ASR对所述音频数据进行处理得到的所述第一语音识别结果。可选的,所述装置还包括:检测模块,配置为检测所述音频数据中是否包含唤醒信息;第二确定模块,配置为如果所述音频数据中包含所述唤醒信息,则确定所述电子设备处于唤醒状态。可选的,所述第一语音识别结果包含与所述音频数据对应的内容长度;所述第一确定模块,还配置为:在第一预设时间内,当所述内容长度大于预设长度阈值时,确定进行所述音频数据的语音端点检测。可选的,所述装置还包括:结束模块,配置为如果在所述第一预设时间内未获取到所述第一语音识别结果,则确定不进行所述音频数据的语音端点检测。可选的,所述装置还包括:第二获取模块,配置为当确定进行所述音频数据的所述语音端点检测后,获取云服务器基于所述音频数据得到的第二语音识别结果;第三确定模块,配置为确定获取到第一第一语音识别结果的第一时刻与获取到第二第一语音识别结果的第二时刻之间的时间间隔;第四确定模块,配置为当所述时间间隔大于或等于第二预设时间时,确定结束所述音频数据的语音端点检测。可选的,所述装置还包括:接收模块,配置为接收云服务器根据所述第一语音识别结果反馈的唤醒响应信息;输出模块,配置为输出所述唤醒响应信息。根据本公开实施例的第三方面,提供一种语音处理装置,应用于电子设备,所述装置包括:处理器;配置为存储处理器可执行指令的存储器;其中,所述处理器配置为:执行时实现上述第一方面中任一种语音处理方法中的步骤。根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由语音处理装置的处理器执行时,使得所述装置能够执行上述第一方面中任一种语音处理方法中的步骤。本公开的实施例提供的技术方案可以包括以下有益效果:由上述实施例可知,本公开实施例中,在采集到音频数据之后,能够获取云服务器基于音频数据得到的第一语音识别结果,并根据第一语音识别结果确定是否进行音频数据的语音端点检测。通过云服务器的语音识别技术辅助电子设备对音频数据的语音端点进行检测,能够使得检测精确度更高,减少由于环境噪声引起的误判停,进而提高语音交互的成功率,提高用户体验感。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是根据一示例性实施例示出的语音处理方法的流程图一。图2是根据一示例性实施例示出的语音处理方法的流程图二。图3是现有技术中一种语音处理方法的流程图。图4是根据一示例性实施例示出的语音处理方法的流程图三。图5是根据一示例性实施例示出的语音处理装置框图。图6是根据一示例性实施例示出的一种语音处理装置的硬件结构框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的语音处理方法的流程图一,如图1所示,该方法应用于电子设备,主要包括以下步骤:在步骤101中,采集音频数据,获取云服务器基于所述音频数据得到的第一语音识别结果;在步骤102中,根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测。本公开实施例中的语音处理方法可以应用于电子设备,其中,电子设备包括移动终端和固定终端。这里,移动终端包括:智能音箱、手机、笔记本电脑、平板电脑、可穿戴式电子设备等,固定终端包括个人计算机、电视等。以电子设备是智能音箱为本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,应用于电子设备,所述方法包括:/n采集音频数据,获取云服务器基于所述音频数据得到的第一语音识别结果;/n根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,应用于电子设备,所述方法包括:
采集音频数据,获取云服务器基于所述音频数据得到的第一语音识别结果;
根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测。


2.根据权利要求1所述的方法,其特征在于,所述获取基于所述音频数据得到的第一语音识别结果,包括:
发送所述音频数据至云服务器;
接收所述云服务器反馈的基于自动语音识别技术ASR对所述音频数据进行处理得到的所述第一语音识别结果。


3.根据权利要求1或2任一项所述的方法,其特征在于,在所述获取基于所述音频数据得到的第一语音识别结果之前,所述方法还包括:
检测所述音频数据中是否包含唤醒信息;
如果所述音频数据中包含所述唤醒信息,则确定所述电子设备处于唤醒状态。


4.根据权利要求1所述的方法,其特征在于,所述第一语音识别结果包含与所述音频数据对应的内容长度;
所述根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测,包括:
在第一预设时间内,当所述内容长度大于预设长度阈值时,确定开始进行所述音频数据的语音端点检测。


5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
如果在所述第一预设时间内未获取到所述第一语音识别结果,则确定不进行所述音频数据的语音端点检测。


6.根据权利要求1或4所述的方法,其特征在于,所述方法还包括:
当确定进行所述音频数据的所述语音端点检测后,获取云服务器基于所述音频数据得到的第二语音识别结果;
确定获取到第一语音识别结果的第一时刻与获取到第二语音识别结果的第二时刻之间的时间间隔;
当所述时间间隔大于或等于第二预设时间时,确定结束所述音频数据的语音端点检测。


7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收云服务器根据所述第一语音识别结果反馈的唤醒响应信息;
输出所述唤醒响应信息。


8.一种语音处理装置,其特征在于,应用于电子设备,所述装置包括:
第一获取模块,配置为采集音频数据,获取云服务器基于所述音频数据得到的第一语音识别结果;
第一确定模块,配置为根据所述第一语音识别结果,确定是否进行所述音频数...

【专利技术属性】
技术研发人员:姬光飞
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1