一种对话管理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33132908 阅读:24 留言:0更新日期:2022-04-17 00:53
本发明专利技术涉及一种对话管理方法、装置、电子设备及存储介质,该方法包括:获取第一语音;将所述第一语音输入对话打断模型,得到所述第一语音对于第一打断类别集合中每一打断类别的得分;所述对话打断模型为利用第一训练数据集预先训练基于深度学习的分类模型得到的;根据所述每一打断类别的得分确定所述第一语音的目标打断类别;根据所述目标打断类别执行对应的打断操作。本发明专利技术预设多种打断类别及每一打断类别相应的打断操作,通过对话打断模型智能对输入的第一语音进行评分,确定出第一语音的目标打断类别,进而执行相应的打断操作,对输入的语音进行了更精确的判断,执行的打断操作也更为精细、合理,适应了语音输入以及用户需求的多样性。求的多样性。求的多样性。

【技术实现步骤摘要】
一种对话管理方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种对话管理方法、装置、电子设备及存储介质。

技术介绍

[0002]口语对话系统广泛应用于智能人机交互场景,打断是口语对话系统中一个常见的问题,系统需要在检测到用户语音输入后,判断是否停止播放语音。现有技术中,常见的打断后处理策略仅仅是判断打断的真假,对于假打断就恢复播报,对于真打断就走正常流程,但是这样是远远不够且并不合理,无法应对语音输入的多样性,以及用户需求的多样性。
[0003]现有口语对话系统中,对语音输入的判断不够精细,无法执行合理的打断策略,导致客户体验较差的问题。针对此缺陷,现亟需一种更为精细、合理的对话管理方案。

技术实现思路

[0004]本专利技术提供一种对话管理方法、装置、电子设备及存储介质,用以解决现有技术中对语音输入的判断不够精细,无法执行合理的打断策略,导致客户体验较差的问题。
[0005]本专利技术提供一种对话管理方法,包括:
[0006]获取第一语音;
[0007]将所述第一语音输入对话打断模型,得到所述第一语音对于第一打断类别集合中每一打断类别的得分;所述对话打断模型为利用第一训练数据集预先训练基于深度学习的分类模型得到的;
[0008]根据所述每一打断类别的得分确定所述第一语音的目标打断类别;
[0009]根据所述目标打断类别执行对应的打断操作。
[0010]根据本专利技术提供的一种对话管理方法,所述第一打断类别集合至少包括下列类别之一:环境噪声、背景人声、问候语、语气词、补充上一轮、抢答当前轮、抢答未播报轮、预设话题范围之外的话题、机器语音。
[0011]根据本专利技术提供的一种对话管理方法,所述根据所述目标打断类别执行对应的打断操作,包括:
[0012]在所述目标打断类别为环境噪声的情况下,恢复语音播报;
[0013]在所述目标打断类别为背景人声的情况下,恢复语音播报;
[0014]在所述目标打断类别为问候语的情况下,恢复语音播报;
[0015]在所述目标打断类别为语气词的情况下,恢复语音播报;
[0016]在所述目标打断类别为补充上一轮的情况下,跳转至上一轮,重新识别用户意图;
[0017]在所述目标打断类别为抢答当前轮的情况下,停止当前轮语音播报,识别用户意图;
[0018]在所述目标打断类别为抢答未播报轮的情况下,重播当前轮语音,后续不再播报已抢答轮语音;
[0019]在所述目标打断类别为预设话题范围之外的话题的情况下,针对所述预设话题范围之外的话题进行应答,应答完毕后重播当前轮语音;
[0020]在所述目标打断类别为机器语音的情况下,结束语音播报。
[0021]根据本专利技术提供的一种对话管理方法,在所述将所述第一语音输入对话打断模型,得到所述第一语音对于第一打断类别集合中每一打断类别的得分之前,还包括:
[0022]确定所述第一语音的强度大于所述第一阈值,则打断当前轮语音播报,并将所述第一语音输入所述对话打断模型。根据本专利技术提供的一种对话管理方法,在所述目标类别为环境噪声或背景人声的情况下,则增大所述第一阈值。
[0023]根据本专利技术提供的一种对话管理方法,所述获取第一语音之前,还包括:
[0024]获取所述第一训练数据集;所述第一训练数据集包括样本语音以及每一样本语音对应的标签数据;
[0025]将所述第一训练数据集拆分为训练集、验证集、测试集;
[0026]根据所述训练集对分类模型进行训练,优化模型的参数;
[0027]根据所述验证集对训练优化后的分类模型进行验证,优化模型的超参数;
[0028]根据所述测试集对验证优化后的分类模型进行测试评估,得到验证优化后的分类模型的泛化误差;
[0029]确定所述泛化误差小于预设阈值,则取所述验证优化后的分类模型为所述对话打断模型。
[0030]根据本专利技术提供的一种对话管理方法,所述对话打断模型采用wide&deep模型。
[0031]本专利技术还提供一种对话管理装置,包括:
[0032]采集模块,用于获取第一语音;
[0033]评分模块,用于将所述第一语音输入对话打断模型,得到所述第一语音对于第一打断类别集合中每一打断类别的得分;所述对话打断模型为利用第一训练数据集预先训练基于深度学习的分类模型得到的;
[0034]判断模块,用于根据所述每一打断类别的得分确定所述第一语音的目标打断类别;
[0035]执行模块,用于根据所述目标打断类别执行对应的打断操作。
[0036]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述对话管理方法的步骤。
[0037]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述对话管理方法的步骤。
[0038]本专利技术提供的一种对话管理方法、装置、电子设备及存储介质,预设多种打断类别及每一打断类别相应的打断操作,通过对话打断模型智能对输入的第一语音进行评分,确定出第一语音的目标打断类别,进而执行相应的打断操作,对输入的语音进行了更精确的判断,执行的打断操作也更为精细、合理,适应了语音输入的多样性以及用户需求的多样性。
附图说明
[0039]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0040]图1是本专利技术提供的一种对话管理方法的流程示意图;
[0041]图2是本专利技术提供的一种对话管理方法中对话打断模型的预训练流程示意图;
[0042]图3是本专利技术提供的一种对话管理装置的结构示意图;
[0043]图4是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0044]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0045]打断是指口语对话系统中系统播报语音时,用户开始了讲话,系统语音和用户语音有重叠的情况。专利技术人在实际工作中发现,现有口语对话系统中,打断之后仅仅只判断打断的真假。而现实的应用场景中,用户的打断往往是多样的,比如回答以前的问题,或者抢先回答了当前问题,或者提前回答了后续还未提出的问题,又或者回答了话题无关的问题等,这里涉及复杂的流程间跳转的问题。对于用户的打断类型,仅仅进行二分类的真假打断判断是不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话管理方法,其特征在于,包括:获取第一语音;将所述第一语音输入对话打断模型,得到所述第一语音对于第一打断类别集合中每一打断类别的得分;所述对话打断模型为利用第一训练数据集预先训练基于深度学习的分类模型得到的;根据所述每一打断类别的得分确定所述第一语音的目标打断类别;根据所述目标打断类别执行对应的打断操作。2.根据权利要求1所述的对话管理方法,其特征在于,所述第一打断类别集合至少包括下列类别之一:环境噪声、背景人声、问候语、语气词、补充上一轮、抢答当前轮、抢答未播报轮、预设话题范围之外的话题、机器语音。3.根据权利要求2所述的对话管理方法,其特征在于,所述根据所述目标打断类别执行对应的打断操作,包括:在所述目标打断类别为环境噪声的情况下,恢复语音播报;在所述目标打断类别为背景人声的情况下,恢复语音播报;在所述目标打断类别为问候语的情况下,恢复语音播报;在所述目标打断类别为语气词的情况下,恢复语音播报;在所述目标打断类别为补充上一轮的情况下,跳转至上一轮,重新识别用户意图;在所述目标打断类别为抢答当前轮的情况下,停止当前轮语音播报,识别用户意图;在所述目标打断类别为抢答未播报轮的情况下,重播当前轮语音,后续不再播报已抢答轮语音;在所述目标打断类别为预设话题范围之外的话题的情况下,针对所述预设话题范围之外的话题进行应答,应答完毕后重播当前轮语音;在所述目标打断类别为机器语音的情况下,结束语音播报。4.根据权利要求2或3所述的对话管理方法,其特征在于,在所述将所述第一语音输入对话打断模型,得到所述第一语音对于第一打断类别集合中每一打断类别的得分之前,还包括:确定所述第一语音的强度大于所述第一阈值,则打断当前轮语音播报,并将所述第一语音输...

【专利技术属性】
技术研发人员:杨久东陈蒙王培英冯明超
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1