语音播报打断处理方法、装置、设备和存储介质制造方法及图纸

技术编号:39288135 阅读:11 留言:0更新日期:2023-11-07 10:58
本发明专利技术实施例提供一种语音播报打断处理方法、装置、设备和存储介质,该方法包括:在人机通话过程中,若在向用户侧播放语音播报音频的过程中检测到用户侧产生的语音信号,则确定语音信号对应的目标文本信息;获取与目标文本信息对应的上文信息,其中,上文信息为在检测到语音信号前于人机通话过程中产生的对话记录;基于上文信息,确定目标文本信息对应的用户意图是否为主观打断播放语音播报音频;若确定出的用户意图为主观打断播放语音播报音频,则停止播放语音播报音频。采用本发明专利技术,能够更加智能化地识别用户真正的意图,满足各种场景下的用户的实际需求。下的用户的实际需求。下的用户的实际需求。

【技术实现步骤摘要】
语音播报打断处理方法、装置、设备和存储介质


[0001]本专利技术涉及智能客服
,尤其涉及一种语音播报打断处理方法、装置、设备和存储介质。

技术介绍

[0002]相关技术中,为了节约人力并提高与客户间的沟通效率,一些商家会引入智能客服为用户提供一些简单的咨询服务。其中,智能客服可以理解为是自动问答系统,即当用户向智能客服提出问题时,智能客服可以分析问题并找到相应的答案,接着会以语音播报的形式向用户反馈答案。
[0003]在某些场景中,客户会打断智能客服的语音播报过程。比如,客户在智能客服未播报完已得到了自己想要的答案,或者,客户发现智能客服给出的答案方向并不是自己想要的等等。在这样的情况下,客户可以对智能客服说“我已经知道了”等表示要打断语音播报过程的语句,相应地,智能客服可以检测到语音信号。当智能客服检测到语音信号时,智能客服会立即结束当前的语音播报过程。
[0004]而并非所有场景下上述打断逻辑都能适用,因此相关技术中的智能客服的智能化程度有待提高,以更好地识别客户的需求。

技术实现思路

[0005]本专利技术实施例提供一种语音播报打断处理方法、装置、设备和存储介质,用以实现提高智能客服的智能化程度,更好地识别客户的需求。
[0006]第一方面,本专利技术实施例提供一种语音播报打断处理方法,该方法包括:在人机通话过程中,若在向用户侧播放语音播报音频的过程中检测到用户侧产生的语音信号,则确定所述语音信号对应的目标文本信息;获取与所述目标文本信息对应的上文信息,其中,所述上文信息为在检测到所述语音信号前于所述人机通话过程中产生的对话记录,所述上文信息中包括由所述语音播报音频转换而来的文本信息;基于所述上文信息,确定所述目标文本信息对应的用户意图是否为主观打断播放所述语音播报音频;若确定出的用户意图为主观打断播放所述语音播报音频,则停止播放所述语音播报音频。
[0007]第二方面,本专利技术实施例提供一种语音播报打断处理装置,包括:确定模块,用于在人机通话过程中,若在向用户侧播放语音播报音频的过程中检测到用户侧产生的语音信号,则确定所述语音信号对应的目标文本信息;获取模块,用于获取与所述目标文本信息对应的上文信息,其中,所述上文信息为在检测到所述语音信号前于所述人机通话过程中产生的对话记录,所述上文信息中包括由所述语音播报音频转换而来的文本信息;
所述确定模块,用于基于所述上文信息,确定所述目标文本信息对应的用户意图是否为主观打断播放所述语音播报音频;停止模块,用于若确定出的用户意图为主观打断播放所述语音播报音频,则停止播放所述语音播报音频。
[0008]第三方面,本专利技术实施例提供一种电子设备,其中包括处理器和存储器,其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少可以实现第一方面中的语音播报打断处理方法。
[0009]第四方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现第一方面中的语音播报打断处理方法。
[0010]采用本专利技术,在人机通话过程中,如果在智能客服向用户侧进行语音播报的过程中检测到用户侧传来了语音信号,则不会立即判定用户想要打断语音播报过程,而是基于检测到的语音信号对应的目标文本信息,同时结合上文信息,对用户意图进行识别,以确认用户是否是主观上要打断语音播报过程。如果用户的确是主观上想要打断语音播报过程,则会停止语音播报。采用这样的方式,能够更加智能化地识别用户真正的意图,满足各种场景下的用户的实际需求。
附图说明
[0011]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0012]图1为本专利技术实施例提供的一种语音播报打断处理方法的流程示意图;图2为本专利技术实施例提供的一种识别用户意图的流程示意图;图3为本专利技术实施例提供的一种电话呼入/呼出处理链路示意图;图4为本专利技术实施例提供的一种语音播报打断处理装置的结构示意图;图5为本专利技术实施例提供的一种电子设备的结构示意图。
具体实施方式
[0013]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0014]在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
[0015]取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述
的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
[0016]另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
[0017]实际应用中,为了节约人力并提高与用户间的沟通效率,一些商家会引入智能客服为用户提供一些简单的咨询服务。其中,智能客服可以理解为是自动问答系统,即当用户向智能客服提出问题时,智能客服可以分析问题并找到相应的答案,接着会以语音播报的形式向用户反馈答案。
[0018]在某些场景中,用户会打断智能客服的语音播报过程。比如,用户在智能客服未播报完已得到了自己想要的答案,或者,用户发现智能客服给出的答案方向并不是自己想要的等等。在这样的情况下,用户可以对智能客服说“我已经知道了”等表示要打断语音播报过程的语句,相应地,智能客服可以检测到语音信号。当智能客服检测到语音信号时,智能客服会立即结束当前的语音播报过程。
[0019]而在某些场景中,用户并非实际要打断智能客服的语音播报过程。比如,用户在收听智能客服播报的过程中又有其他用户和用户交谈了几句,但是对于智能客服来说,在这样的情况下仍然会检测到语音信号。
[0020]基于上述检测到语音信号的处理逻辑,智能客服会认为用户不想继续收听语音播报了,此时智能客服会立即结束当前的语音播报,甚至是对用户与其他用户的交谈内容做出不必要的回应。然而实际情况是,用户并未要实际打断智能客服的语音播报过程,用户还未从已播报的内容中完全了解自己想要知道的信息。由此可见,智能客服的智能化程度有待提高,以更好地识别用户的需求。
[0021本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音播报打断处理方法,其特征在于,包括:在人机通话过程中,若在向用户侧播放语音播报音频的过程中检测到用户侧产生的语音信号,则确定所述语音信号对应的目标文本信息;获取与所述目标文本信息对应的上文信息,其中,所述上文信息为在检测到所述语音信号前于所述人机通话过程中产生的对话记录,所述上文信息中包括由所述语音播报音频转换而来的文本信息;基于所述上文信息,确定所述目标文本信息对应的用户意图是否为主观打断播放所述语音播报音频;若确定出的用户意图为主观打断播放所述语音播报音频,则停止播放所述语音播报音频。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若确定出的用户意图不是主观打断播放所述语音播报音频,则暂停播放所述语音播报音频并记录暂停播放所述语音播报音频时的播报断点;当检测到预设播报启动事件时,基于所述播报断点继续播放所述语音播报音频。3.根据权利要求2所述的方法,其特征在于,所述基于所述播报断点继续播放所述语音播报音频,包括:从所述播报断点起始继续播放所述语音播报音频;或,在所述语音播报音频中确定在所述播报断点前预设时长的播报续点;从所述播报续点起始继续播放所述语音播报音频。4.根据权利要求1所述的方法,其特征在于,所述基于所述上文信息,确定所述目标文本信息对应的用户意图是否为主观打断播放所述语音播报音频,包括:将所述上文信息以及所述目标文本信息输入到预先训练的上下文关联识别模型中,得到所述目标文本信息与所述上文信息间的关联度;若所述关联度大于或者等于预设阈值,则确定所述目标文本信息对应的用户意图是主观打断播放所述语音播报音频;若所述关联度小于所述预设阈值,则确定所述目标文本信息对应的用户意图不是主观打断播放所述语音播报音频。5.根据权利要求4所述的方法,其特征在于,在将所述上文信息以及所述目标文本信息输入到预先训练的上下文关联识别模型中之前,所述方法还包括:判断所述目标文本信息中是否包括具有主观打断含义的关键字;若所述目标文本信息中包括所述关键字,则确定所述目标文本信息对应的用户意图是主观打断播放所述语音播报音频;若所述目标文本信息中不包括所述关键字,则将所述上文信息以及所述目标文本信息输入到预先训练的上下文关联识别模型中。6.根据权利要求4所述的方法,其特征在于,所述将所述上文信息以及所述目标文本信息输入到预先训练的上下文关联识别模型中,包括:基于所述上文信息,确定当前的对话场景;在多个预先训练的上下文关联识别模型中,确定与所述当前的对话场景对应的上下文关联识别模型;
...

【专利技术属性】
技术研发人员:王传奇
申请(专利权)人:北京百悟科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1