一种语音处理方法、电子设备及存储介质技术

技术编号:29616855 阅读:35 留言:0更新日期:2021-08-10 18:35
本申请实施例提供了一种语音处理方法、电子设备及存储介质,涉及计算机技术领域,包括:持续采集语音数据,并获得对持续采集的语音数据进行语音识别得到的文本数据;对持续采集的语音数据进行静音检测;在静音时长达到预设的语音停顿时长后,对已获得的文本数据进行自然语言处理,得到处理结果;在所述静音时长达到所述预设的语音停顿时长、且未达到预设的语音结束时长的情况下,若检测到静音结束,确定所述处理结果无效,其中,所述预设的语音结束时长大于所述预设的语音停顿时长;在所述静音时长达到所述预设的语音结束时长后,将所述处理结果确定为针对持续采集的语音数据的响应结果。应用本申请实施例提供的方案,可以提高语音处理效率。

【技术实现步骤摘要】
一种语音处理方法、电子设备及存储介质
本申请涉及计算机
,特别是涉及一种语音处理方法、电子设备及存储介质。
技术介绍
在人机交互场景中,用户可以通过语音向交互设备发送控制指令、服务请求等,交互设备可以对用户发出的语音进行响应,提高人机交互的便捷性。相关技术中,可以采集用户所发出语音的语音数据,对所采集的语音数据进行语音识别,得到文本数据。在检测到用户结束发出语音之后,针对上述文本数据进行自然语言处理,进而利用处理结果实现对用户所发出语音的响应。应用上述方案虽然可以对用户发出的语音进行响应,但是只有在检测到用户结束发出语音后才开始进行自然语言处理,而检测用户结束发出语音需要消耗较长的时间,并且在检测到语音结束之后还需要消耗时间来进行自然语言处理,从而导致对用户发出的语音进行响应的耗时较长,语音处理效率低,降低了用户体验。
技术实现思路
本申请实施例的目的在于提供一种语音处理方法、电子设备及存储介质,以提高语音处理效率。具体技术方案如下:第一方面,本申请实施例提供了一种语音处理方法,所述方法包括:持续采集语音数据,并获得对持续采集的语音数据进行语音识别得到的文本数据;对持续采集的语音数据进行静音检测;在静音时长达到预设的语音停顿时长后,对已获得的文本数据进行自然语言处理,得到处理结果;在所述静音时长达到所述预设的语音停顿时长、且未达到预设的语音结束时长的情况下,若检测到静音结束,确定所述处理结果无效,其中,所述预设的语音结束时长大于所述预设的语音停顿时长;在所述静音时长达到所述预设的语音结束时长后,将所述处理结果确定为针对持续采集的语音数据的响应结果。本申请的一个实施例中,所述若检测到静音结束,确定所述处理结果无效,包括:若检测到静音结束,且下一文本数据不同于参考文本数据,确定所述处理结果无效,其中,所述下一文本数据为:在下一次检测到所述静音时长达到所述预设的语音停顿时长时,所获得的对持续采集的语音数据进行语音识别得到的文本数据,所述参考文本数据为:获得所述处理结果时所基于的文本数据;所述在静音时长达到预设的语音停顿时长后,对已获得的文本数据进行自然语言处理,得到处理结果,包括:在静音时长达到预设的语音停顿时长后,若所述下一文本数据与所述参考文本数据不一致,对已获得的文本数据进行自然语言处理,得到处理结果。本申请的一个实施例中,所述对已获得的文本数据进行自然语言处理,得到处理结果,包括:检测已获得的文本数据是否完整;在已获得的文本数据完整的情况下,对已获得的文本数据进行自然语言处理,得到处理结果。本申请的一个实施例中,所述检测已获得的文本数据是否完整,包括:针对所述文本数据中的每一字符,获得该字符的出现概率,其中,每一字符的出现概率为:该字符出现在参考字符之后、且出现在当前位置的概率,所述参考字符为:该字符之前预设数量个字符;根据所述文本数据中各个字符的出现概率,获得所述文本数据的出现概率;在所述文本数据的出现概率达到预设的概率阈值的情况下,确定所述文本数据完整。本申请的一个实施例中,所述针对所述文本数据中的每一字符,获得该字符的出现概率,包括:针对所述文本数据中的每一字符,确定预设的文本语料中第一连续字符出现的第一次数,并确定所述文本语料中第二连续字符出现的第二次数;根据所述第一次数、第二次数,计算该字符的出现概率,其中,所述第二连续字符包括:所述文本数据中该字符之前所述预设数量个字符,所述第一连续字符包括:所述第二连续字符以及该字符。本申请的一个实施例中,所述在所述文本数据出现的概率达到预设的概率阈值的情况下,确定所述文本数据完整,包括:确定所述文本数据的目标字符数量;从字符数量与概率阈值的预设对应关系中,确定所述目标字符数量对应的概率阈值;在所述文本数据的出现概率达到所确定的概率阈值的情况下,确定所述文本数据完整。本申请的一个实施例中,所述根据所述文本数据中各个字符的出现概率,获得所述文本数据的出现概率,包括:计算所述文本数据中各个字符的出现概率的乘积,作为所述文本数据的出现概率。本申请的一个实施例中,所述对持续采集的语音数据进行静音检测,包括:检测持续采集的语音数据中的低波幅数据,记录所检测的低波幅数据的持续时长,其中,所述低波幅数据为:信号的波幅低于预设波幅阈值的语音数据。第二方面,本申请实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。第三方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的语音处理方法。本申请实施例有益效果:本申请实施例提供的语音处理方案中,持续采集语音数据,并获得对持续采集的语音数据进行语音识别得到的文本数据;对持续采集的语音数据进行静音检测;在静音时长达到预设的语音停顿时长后,对已获得的文本数据进行自然语言处理,得到处理结果;在静音时长达到预设的语音停顿时长、且未达到预设的语音结束时长的情况下,若检测到静音结束,确定处理结果无效,其中,预设的语音结束时长大于预设的语音停顿时长;在静音时长达到预设的语音结束时长后,将处理结果确定为针对持续采集的语音数据的响应结果。这样可以在静音时长达到预设的语音停顿时长之后,即可对已采集的语音数据对应的文本数据进行自然语言处理,等待静音时长达到预设的语音结束时长的过程中,可以获得上述自然语言处理结果,在静音时长达到预设的语音结束时长后,认为语音结束,这种情况下由于已经得到了处理结果,因此可以直接基于上述处理结果对语音数据进行响应,节省自然语言处理耗时。由此可见,应用本申请实施例提供的方案,可以提高语音处理效率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的实施例。图1为本申请实施例提供的一种语音处理方法的流程示意图;图2为本申请实施例提供的一种语音数据的信号的幅度示意图;图3为本申请实施例提供的另一种语音数据的信号的幅度示意图;图4为本申请实施例提供的一种文本数据检测方法的流程示意图;图5为本申请实施例提供的另一种语音处理方法的流程示意图;图6为本申请实施例提供的一种自然语言处理的信令交互示意图;图7为本申请实施例提供的另一种自然语言处理的信令交互示意图;图8为本申请实施例提供的一种语音处理时间节点的示意图;图9为本申请实施例提供的一种语音处理装置本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,所述方法包括:/n持续采集语音数据,并获得对持续采集的语音数据进行语音识别得到的文本数据;/n对持续采集的语音数据进行静音检测;/n在静音时长达到预设的语音停顿时长后,对已获得的文本数据进行自然语言处理,得到处理结果;/n在所述静音时长达到所述预设的语音停顿时长、且未达到预设的语音结束时长的情况下,若检测到静音结束,确定所述处理结果无效,其中,所述预设的语音结束时长大于所述预设的语音停顿时长;/n在所述静音时长达到所述预设的语音结束时长后,将所述处理结果确定为针对持续采集的语音数据的响应结果。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:
持续采集语音数据,并获得对持续采集的语音数据进行语音识别得到的文本数据;
对持续采集的语音数据进行静音检测;
在静音时长达到预设的语音停顿时长后,对已获得的文本数据进行自然语言处理,得到处理结果;
在所述静音时长达到所述预设的语音停顿时长、且未达到预设的语音结束时长的情况下,若检测到静音结束,确定所述处理结果无效,其中,所述预设的语音结束时长大于所述预设的语音停顿时长;
在所述静音时长达到所述预设的语音结束时长后,将所述处理结果确定为针对持续采集的语音数据的响应结果。


2.根据权利要求1所述的方法,其特征在于,所述若检测到静音结束,确定所述处理结果无效,包括:
若检测到静音结束,且下一文本数据不同于参考文本数据,确定所述处理结果无效,其中,所述下一文本数据为:在下一次检测到所述静音时长达到所述预设的语音停顿时长时,所获得的对持续采集的语音数据进行语音识别得到的文本数据,所述参考文本数据为:获得所述处理结果时所基于的文本数据;
所述在静音时长达到预设的语音停顿时长后,对已获得的文本数据进行自然语言处理,得到处理结果,包括:
在静音时长达到预设的语音停顿时长后,若所述下一文本数据与所述参考文本数据不一致,对已获得的文本数据进行自然语言处理,得到处理结果。


3.根据权利要求1所述的方法,其特征在于,所述对已获得的文本数据进行自然语言处理,得到处理结果,包括:
检测已获得的文本数据是否完整;
在已获得的文本数据完整的情况下,对已获得的文本数据进行自然语言处理,得到处理结果。


4.根据权利要求3所述的方法,其特征在于,所述检测已获得的文本数据是否完整,包括:
针对所述文本数据中的每一字符,获得该字符的出现概率,其中,每一字符的出现概率为:该字符出现在参考字符之后、且出现在当前位置的概率,所述参考字符为:该字符之前预设数量个字符;
根据所述文本数据中各个字符的出现概率,获得所述文本数据的出现概率;

【专利技术属性】
技术研发人员:孙晓欣黄海荣李林峰石渊
申请(专利权)人:湖北亿咖通科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1