开放式对话方法、装置、电子设备及介质制造方法及图纸

技术编号:38336005 阅读:9 留言:0更新日期:2023-08-02 09:16
本发明专利技术涉及自然语言领域,揭露一种开放式对话方法,包括:从对话数据中抽取对话实体,根据对话实体构建提问文本;判断提问文本是否为第一类问题;若提问文本为第一类问题,则基于数据库生成提问文本的回复文本;若提问文本不为第一类问题,则判断提问文本是否为第二类问题;若提问文本为第二类问题,则从智能客服系统中获取提问文本对应的用户信息,并将用户信息推送至工作人员;若提问文本不为第二类问题,则获取提问文本的指代关系,并进行指代消解,得到消解提问文本;基于预设的自然语言生成方法生成消解提问文本的对话答复,并将对话答复进行筛查后发送至用户。本发明专利技术可以提高智能对话的准确度。能对话的准确度。能对话的准确度。

【技术实现步骤摘要】
开放式对话方法、装置、电子设备及介质


[0001]本专利技术涉及自然语言
,尤其涉及一种开放式对话方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]对话系统常常应用于网络社交和个人助手应用场景中,现有的对话系统中的对话内容一般只是任务式对话,如定闹钟提醒,查询天气等,无法进行需求更高的开放式对话。例如,医疗领域中,进行对话时,常常是基于一套模板化的症状自诊工具,系统提示患者选择主要的患病症状,并根据主要症状调取对应的问诊模板进行问诊,而所谓的问诊也是一些封闭性质的选择题,不具备和患者进行正常交流沟通的能力,也无法对患者在模板之外的对话进行回应。即,现有技术中对话系统无法进行有效的开放式对话。

技术实现思路

[0003]本专利技术提供一种开放式对话方法、装置、电子设备及计算机可读存储介质,其主要目的在于实现有效的开放式对话,提高智能对话的准确度。
[0004]为实现上述目的,本专利技术提供的一种开放式对话方法,包括:
[0005]获取智能客服系统中存储的用户的对话数据,并从所述对话数据中抽取对话实体,根据所述对话实体构建提问文本;
[0006]判断所述提问文本是否为第一类问题;
[0007]若所述提问文本为第一类问题,则查询所述智能客服系统的数据库,并基于所述数据库生成所述提问文本的回复文本;
[0008]若所述提问文本不为第一类问题,则判断所述提问文本是否为第二类问题;
[0009]若所述提问文本为第二类问题,则从所述智能客服系统中获取所述提问文本对应的用户信息,并将所述用户信息推送至工作人员;
[0010]若所述提问文本不为第二类问题,则获取所述提问文本的指代关系,并进行指代消解,得到消解提问文本;
[0011]基于预设的自然语言生成方法生成所述消解提问文本的对话答复,并将所述对话答复进行筛查后发送至所述用户。
[0012]可选地,所述从所述对话数据中抽取对话实体,根据所述对话实体构建提问文本,包括:
[0013]根据所述对话数据构建实体列表,并根据所述对话实体构建提问文本;
[0014]获取所述用户的身份标识,根据所述身份标识在所述智能客服系统中查询是否存在所述用户的历史数据;
[0015]若所述智能客服系统中存在所述用户的历史数据,则查询所述历史数据中是否存在所述对话实体对应的问答数据,若存在,则根据所述问答数据构建提问文本;
[0016]若所述智能客服系统中不存在所述用户的历史数据,则从所述智能客服系统中获
取所述对话实体对应的对话实体问答,并根据所述对话实体问答构建提问文本。
[0017]可选地,所述根据所述对话数据构建实体列表,并根据所述对话实体构建提问文本,包括:
[0018]根据所述对话数据中的实体构建第一实体列表;
[0019]获取所述对话数据的上文对话语料以及所述上文对话语料对应的历史话题路径;
[0020]根据所述上文对话语料以及所述上文对话语料对应的历史话题路径构建第二实体列表;
[0021]将存在于所述第一实体列表且不存在于所述第二实体列表中的话题实体作为新增话题实体;
[0022]将所述新增话题实体作为所述对话数据中抽取的所述对话实体。
[0023]可选地,所述从所述对话数据中抽取对话实体之前,所述方法还包括:
[0024]从所述智能客服系统中获取对话记录;
[0025]将所述对话记录文本化,得到对话文本,并将所述对话文本进行切分得到对话切分单元;
[0026]通过预设的文本表示模型将所述对话切分单元转化为对话单元矩阵;
[0027]基于所述对话单元矩阵,通过序列标注方法计算所述对话记录的对话意图;
[0028]判断所述对话意图和预设目标对话意图是否相同;
[0029]若所述对话意图和所述目标对话意图相同,则将所述对话记录数据化,得到对话数据;
[0030]若所述对话意图和所述目标对话意图不同,则将所述对话记录舍弃,并重新获取对话记录。
[0031]可选地,所述基于所述数据库生成所述提问文本的回复文本,包括:
[0032]从所述数据库中获取所述提问文本的上轮系统回复语言和上轮对话状态表示;
[0033]对所述提问文本进行分词处理,得到多个提问分词;
[0034]根据所述提问分词和所述上轮对话状态表示,得到指示一个对话领域的当前对话状态表示;
[0035]基于所述当前对话状态表示,从所述数据库的历史信息中查询符合要求的实体,得到所述提问文本对应的回复信息表示;
[0036]基于所述提问文本、所述当前对话状态和所述回复信息表示,得到涵盖所述提问文本语言相关的所有领域的回复文本。
[0037]可选地,所述获取所述提问文本的指代关系,并进行指代消解,得到消解提问文本,包括:
[0038]从所述数据库中获取历史对话文本集,并根据所述历史对话文本集中的数据进行样本构建及多标签标记,得到第一训练样本集;
[0039]对所述第一训练样本集中的训练样本进行近义词替换及指代词替换,得到第二训练样本集;
[0040]利用所述第二训练样本集对预构建的深度学习模型进行训练,得到分类标识模型;
[0041]当接收所述提问文本时,通过所述分类识别模型对所述提问文本进行上下文关联
分析,得到分析结果;
[0042]根据所述分析结果对所述提问文本进行分类指代消解,得到消解提问文本。
[0043]可选地,所述基于预设的自然语言生成方法生成所述消解提问文本的对话答复,包括:
[0044]通过所述自然语言生成方法中的编码器对所述消解提问文本的文本编码;
[0045]利用所述自然语言生成方法中的译码器解码所述文本编码,得到所述文本编码的预测文本序列,并通过所述预测文本序列得到所述消解提问文本的对话答复。
[0046]为了解决上述问题,本专利技术还提供一种开放式对话装置,所述装置包括:
[0047]提问文本构建模块,用于获取智能客服系统中存储的用户的对话数据,并从所述对话数据中抽取对话实体,根据所述对话实体构建提问文本;
[0048]第一类问题筛选模块,用于判断所述提问文本是否为第一类问题,若所述提问文本为第一类问题,则查询所述智能客服系统的数据库,并基于所述数据库生成所述提问文本的回复文本,若所述提问文本不为第一类问题,则判断所述提问文本是否为第二类问题;
[0049]第二类问题筛选模块,用于若所述提问文本为第二类问题,则从所述智能客服系统中获取所述提问文本对应的用户信息,并将所述用户信息推送至工作人员,若所述提问文本不为第二类问题,则获取所述提问文本的指代关系,并进行指代消解,得到消解提问文本;
[0050]对话答复生成模块,用于基于预设的自然语言生成方法生成所述消解提问文本的对话答复,并将所述对话答复进行筛查后发送至所述用户。
[0051]为了本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种开放式对话方法,其特征在于,所述方法包括:获取智能客服系统中存储的用户的对话数据,并从所述对话数据中抽取对话实体,根据所述对话实体构建提问文本;判断所述提问文本是否为第一类问题;若所述提问文本为第一类问题,则查询所述智能客服系统的数据库,并基于所述数据库生成所述提问文本的回复文本;若所述提问文本不为第一类问题,则判断所述提问文本是否为第二类问题;若所述提问文本为第二类问题,则从所述智能客服系统中获取所述提问文本对应的用户信息,并将所述用户信息推送至工作人员;若所述提问文本不为第二类问题,则获取所述提问文本的指代关系,并进行指代消解,得到消解提问文本;基于预设的自然语言生成方法生成所述消解提问文本的对话答复,并将所述对话答复进行筛查后发送至所述用户。2.如权利要求1所述的开放式对话方法,其特征在于,所述从所述对话数据中抽取对话实体,根据所述对话实体构建提问文本,包括:根据所述对话数据构建实体列表,并根据所述对话实体构建提问文本;获取所述用户的身份标识,根据所述身份标识在所述智能客服系统中查询是否存在所述用户的历史数据;若所述智能客服系统中存在所述用户的历史数据,则查询所述历史数据中是否存在所述对话实体对应的问答数据,若存在,则根据所述问答数据构建提问文本;若所述智能客服系统中不存在所述用户的历史数据,则从所述智能客服系统中获取所述对话实体对应的对话实体问答,并根据所述对话实体问答构建提问文本。3.如权利要求2所述的开放式对话方法,其特征在于,所述根据所述对话数据构建实体列表,并根据所述对话实体构建提问文本,包括:根据所述对话数据中的实体构建第一实体列表;获取所述对话数据的上文对话语料以及所述上文对话语料对应的历史话题路径;根据所述上文对话语料以及所述上文对话语料对应的历史话题路径构建第二实体列表;将存在于所述第一实体列表且不存在于所述第二实体列表中的话题实体作为新增话题实体;将所述新增话题实体作为所述对话数据中抽取的所述对话实体。4.如权利要求1所述的开放式对话方法,其特征在于,所述从所述对话数据中抽取对话实体之前,所述方法还包括:从所述智能客服系统中获取对话记录;将所述对话记录文本化,得到对话文本,并将所述对话文本进行切分得到对话切分单元;通过预设的文本表示模型将所述对话切分单元转化为对话单元矩阵;基于所述对话单元矩阵,通过序列标注方法计算所述对话记录的对话意图;判断所述对话意图和预设目标对话意图是否相同;
若所述对话意图和所述目标对话意图相同,则将所述对话记录数据化,得到对话数据;若所述对话意图和所述目标对话意图不同,则将所述对话记录舍弃,并重新获取对话记录。5.如权利要求1所述的开放式对话方法,其特征在于,所述基于所述数据库生成所述提问文本的回复文本,包括:从所述数据库中获取所述提问文本的上轮系统回复语言和上轮对话状态表示;对所述提问文本进行分词处理,得到多个...

【专利技术属性】
技术研发人员:王世朋刘佳瑞姚海申尹婧煜
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1