中断音频交互的方法、装置以及存储介质制造方法及图纸

技术编号:30424022 阅读:11 留言:0更新日期:2021-10-24 16:53
本申请公开了一种中断音频交互的方法、装置以及存储介质。其中,该方法包括:确定与交互音频对应的发音时长信息序列以及中断时间信息,其中发音时长信息序列用于记录与交互音频包含的单词对应的发音时长信息,中断时间信息用于指示交互音频可以进行中断的位置;在利用交互音频与目标用户进行交互的过程中,接收目标用户发出的音频;根据发音时长信息序列确定目标用户发出音频的时间节点;以及根据时间节点以及中断时间信息,判断是否对与目标用户进行音频交互的过程进行中断。行音频交互的过程进行中断。行音频交互的过程进行中断。

【技术实现步骤摘要】
中断音频交互的方法、装置以及存储介质


[0001]本申请涉及互联网
,特别是涉及一种中断音频交互的方法、装置以及存储介质。

技术介绍

[0002]在基于语音媒体的智能交互系统中,与真实客户进行通话的往往是智能语音机器人程序,这些程序在交互中收集判断用户的需求、意图、疑问并提供相应话术的解答,从而完成如通知、推销、回访、售后等一般商业任务。
[0003]机器人对有些话术语音播放时间较长,且没有命中用户疑问时,用户可能希望打断这段录音播放并再次强调自己的问题。这时机器人应该能及时响应,停止当前话术的播放,接听和判断用户的真实问题,并做出话术调整。
[0004]但是,出于话术前后连贯性、完整性、或者机器人使用商的商业目标,有些话术部分,机器人是不允许被打断的。现有技术中采用的方式为预先存储好用户的声纹特征,当机器人播放声音过程中,对用户信道声音做声纹识别判断,如果是通话用户,则打断播放;否则继续播放。然而这种方式不能精准的控制打断音频通话的位置,因此灵活度较差。
[0005]针对上述的现有技术中存在的不能精准的控制打断音频的位置,因此影响音频打断的灵活度的技术问题,目前尚未提出有效的解决方案。

技术实现思路

[0006]本公开的实施例提供了一种中断音频交互的方法、装置以及存储介质,以至少解决现有技术中存在的不能精准的控制打断音频的位置,因此影响音频打断的灵活度的技术问题。
[0007]根据本公开实施例的一个方面,提供了一种中断音频交互的方法,用于在与目标用户进行音频交互的过程中进行中断,该方法包括:确定与交互音频对应的发音时长信息序列以及中断时间信息,其中发音时长信息序列用于记录与交互音频包含的单词对应的发音时长信息,中断时间信息用于指示交互音频可以进行中断的位置;在利用交互音频与目标用户进行交互的过程中,接收目标用户发出的音频;根据发音时长信息序列确定目标用户发出音频的时间节点;以及根据时间节点以及中断时间信息,判断是否对与目标用户进行音频交互的过程进行中断。
[0008]根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
[0009]根据本公开实施例的另一个方面,还提供了一种中断音频交互的装置,用于在与目标用户进行音频交互的过程中进行中断,包括:序列确定模块,用于确定与交互音频对应的发音时长信息序列以及中断时间信息,其中发音时长信息序列用于记录与交互音频包含的单词对应的发音时长信息,中断时间信息用于指示交互音频可以进行中断的位置;音频接收模块,用于在利用交互音频与目标用户进行交互的过程中,接收目标用户发出的音频;
节点确定模块,用于根据发音时长信息序列确定目标用户发出音频的时间节点;以及中断判断模块,用于根据时间节点以及中断时间信息,判断是否对与目标用户进行音频交互的过程进行中断。
[0010]根据本公开实施例的另一个方面,还提供了一种中断音频交互的装置,用于在与目标用户进行音频交互的过程中进行中断,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:确定与交互音频对应的发音时长信息序列以及中断时间信息,其中发音时长信息序列用于记录与交互音频包含的单词对应的发音时长信息,中断时间信息用于指示交互音频可以进行中断的位置;在利用交互音频与目标用户进行交互的过程中,接收目标用户发出的音频;根据发音时长信息序列确定目标用户发出音频的时间节点;以及根据时间节点以及中断时间信息,判断是否对与目标用户进行音频交互的过程进行中断。
[0011]在本公开实施例中,系统可以根据发音时长信息序列计算用户发出音频的时间节点,然后根据中断时间信息判断是否对与目标用户进行音频交互的过程进行中断。从而,实现了精准控制通话打断位置的目的,达到了提高系统的灵活性的技术效果。进而解决了现有技术中存在的不能精准的控制打断音频的位置,因此影响音频打断的灵活度的技术问题。
附图说明
[0012]此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
[0013]图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
[0014]图2是根据本公开实施例1的第一个方面所述的中断音频交互的方法的流程示意图;
[0015]图3是根据本公开实施例1所述的中断音频交互的整体流程图;
[0016]图4是根据本公开实施例2所述的中断音频交互的装置的示意图;
[0017]图5是根据本公开实施例3所述的中断音频交互的装置的示意图。
具体实施方式
[0018]为了使本
的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
[0019]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品
或设备固有的其它步骤或单元。
[0020]实施例1
[0021]根据本实施例,提供了一种中断音频交互的方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0022]本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现中断音频交互的方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
[0023]应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种中断音频交互的方法,用于在与目标用户进行音频交互的过程中进行中断,其特征在于,包括:确定与交互音频对应的发音时长信息序列以及中断时间信息,其中所述发音时长信息序列用于记录与所述交互音频包含的单词对应的发音时长信息,所述中断时间信息用于指示所述交互音频可以进行中断的位置;在利用所述交互音频与所述目标用户进行交互的过程中,接收所述目标用户发出的音频;根据所述发音时长信息序列确定所述目标用户发出所述音频的时间节点;以及根据所述时间节点以及所述中断时间信息,判断是否对与所述目标用户进行音频交互的过程进行中断。2.根据权利要求1所述的方法,其特征在于,确定与交互音频对应的发音时长信息序列,包括:确定与所述交互音频对应的文本信息;确定由所述文本信息包含的连续单词组成的词元序列;以及根据所述词元序列,确定与交互音频对应的发音时长信息序列。3.根据权利要求2所述的方法,其特征在于,根据所述词元序列,确定与交互音频对应的发音时长信息序列,包括:利用预先训练的文本对齐模型对所述词元序列进行预测,确定所述发音时长信息序列。4.根据权利要求2所述的方法,其特征在于,还包括:计算所述发音时长信息序列的发音时长总和作为第一时长,计算所述交互音频的播放时长作为第二时长;根据所述第一时长和所述第二时长,将所述发音时长信息序列中的每个单词的发音时长进行等比缩放,确定所述词元序列对应的实际发音时长信息序列,并且根据所述发音时长信息序列确定所述目标用户发出所述音频的时间节点,包括:根据所述实际发音时长信息序列确定所述目标用户发出所述音频的时间节点。5.根据权利要求2所述的方法,其特征在于,确定由所述文本信息包含的连续单词组成的词元序列,包括:对所述文本信息进行分词操作,确定由所述文本信息包含的连续单词组成的词元序列。6.根据权利要求1所述的方法,其特征在于,根据所述时间节点以及所述中断时间信息,判断是否对与所述目标用户进行音频交互的过程进行中断,包括:确定与所述中断时间信息对应的中断区间;以及...

【专利技术属性】
技术研发人员:乔宏利何朋杨春勇权圣
申请(专利权)人:北京有限元科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1