中断音频交互的方法、装置以及存储介质制造方法及图纸

技术编号：30424022 阅读：11 留言：0更新日期：2021-10-24 16:53

本申请公开了一种中断音频交互的方法、装置以及存储介质。其中，该方法包括：确定与交互音频对应的发音时长信息序列以及中断时间信息，其中发音时长信息序列用于记录与交互音频包含的单词对应的发音时长信息，中断时间信息用于指示交互音频可以进行中断的位置；在利用交互音频与目标用户进行交互的过程中，接收目标用户发出的音频；根据发音时长信息序列确定目标用户发出音频的时间节点；以及根据时间节点以及中断时间信息，判断是否对与目标用户进行音频交互的过程进行中断。行音频交互的过程进行中断。行音频交互的过程进行中断。

全部详细技术资料下载

【技术实现步骤摘要】
中断音频交互的方法、装置以及存储介质

[0001]本申请涉及互联网
，特别是涉及一种中断音频交互的方法、装置以及存储介质。

技术介绍

[0002]在基于语音媒体的智能交互系统中，与真实客户进行通话的往往是智能语音机器人程序，这些程序在交互中收集判断用户的需求、意图、疑问并提供相应话术的解答，从而完成如通知、推销、回访、售后等一般商业任务。
[0003]机器人对有些话术语音播放时间较长，且没有命中用户疑问时，用户可能希望打断这段录音播放并再次强调自己的问题。这时机器人应该能及时响应，停止当前话术的播放，接听和判断用户的真实问题，并做出话术调整。
[0004]但是，出于话术前后连贯性、完整性、或者机器人使用商的商业目标，有些话术部分，机器人是不允许被打断的。现有技术中采用的方式为预先存储好用户的声纹特征，当机器人播放声音过程中，对用户信道声音做声纹识别判断，如果是通话用户，则打断播放；否则继续播放。然而这种方式不能精准的控制打断音频通话的位置，因此灵活度较差。
[0005]针对上述的现有技术中存在的不能精准的控制打断音频的位置，因此影响音频打断的灵活度的技术问题，目前尚未提出有效的解决方案。

技术实现思路

[0006]本公开的实施例提供了一种中断音频交互的方法、装置以及存储介质，以至少解决现有技术中存在的不能精准的控制打断音频的位置，因此影响音频打断的灵活度的技术问题。
[0007]根据本公开实施例的一个方面，提供了一种中断音频交互的方法，用于在与目标用户进行音频交互...

【技术保护点】

【技术特征摘要】
1.一种中断音频交互的方法，用于在与目标用户进行音频交互的过程中进行中断，其特征在于，包括：确定与交互音频对应的发音时长信息序列以及中断时间信息，其中所述发音时长信息序列用于记录与所述交互音频包含的单词对应的发音时长信息，所述中断时间信息用于指示所述交互音频可以进行中断的位置；在利用所述交互音频与所述目标用户进行交互的过程中，接收所述目标用户发出的音频；根据所述发音时长信息序列确定所述目标用户发出所述音频的时间节点；以及根据所述时间节点以及所述中断时间信息，判断是否对与所述目标用户进行音频交互的过程进行中断。2.根据权利要求1所述的方法，其特征在于，确定与交互音频对应的发音时长信息序列，包括：确定与所述交互音频对应的文本信息；确定由所述文本信息包含的连续单词组成的词元序列；以及根据所述词元序列，确定与交互音频对应的发音时长信息序列。3.根据权利要求2所述的方法，其特征在于，根据所述词元序列，确定与交互音频对应的发音时长信息序列，包括：利用预先训练的文本对齐模型对所述词元序列进行预测，确定所述发音时长信息序列。4.根据权利要求2所述的方法，其特征在于，还包括：计算所述发音时长信息序列的发音时长总和作为第一时长，计算所述交互音频的播放时长作为第二时长；根据所述第一时长和所述第二时长，将所述发音时长信息序列中的每个单词的发音时长进行等比缩放，确定所述词元序列对应的实际发音时长信息序列，并且根据所述发音时长信息序列确定所述目标用户发出所述音频的时间节点，包括：根据所述实际发音时长信息序列确定所述目标用户发出所述音频的时间节点。5.根据权利要求2所述的方法，其特征在于，确定由所述文本信息包含的连续单词组成的词元序列，包括：对所述文本信息进行分词操作，确定由所述文本信息包含的连续单词组成的词元序列。6.根据权利要求1所述的方法，其特征在于，根据所述时间节点以及所述中断时间信息，判断是否对与所述目标用户进行音频交互的过程进行中断，包括：确定与所述中断时间信息对应的中断区间；以及...

【专利技术属性】
技术研发人员：乔宏利，何朋，杨春勇，权圣，
申请(专利权)人：北京有限元科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人