对话处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:37263438 阅读:13 留言:0更新日期:2023-04-20 23:36
本申请涉及一种对话处理方法、装置、计算机设备和存储介质。所述方法包括:获取当前对话文本;根据当前对话文本,提取当前对话文本的实体;在预设知识图谱数据库中,查询与实体相关的相关实体,预设知识图谱数据库存储有预设对话文本的预设实体,以及预设实体之间的预设实体关系;根据实体与相关实体之间的实体关系,对实体与相关实体进行编码,得到当前对话文本对应的稠密向量;基于稠密向量以及预先训练的对话模型,确定当前对话文本的对话结果。采用本申请实施例的方法,能够避免获取大量的训练数据,并提高输出的对话结果的准确性,从而有效提高人机对话的效率。而有效提高人机对话的效率。而有效提高人机对话的效率。

【技术实现步骤摘要】
对话处理方法、装置、计算机设备和存储介质


[0001]本申请涉及通信
,特别是涉及一种对话处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着通信技术、人机交互和自然语言处理的发展,面向任务的对话系统越来越受到关注。在面向任务的对话系统中,主要包括两大类型的对话策略,其一,基于规则的状态转移策略,即根据用户的输入条件,触发相应的系统对话行为;其二,基于端到端的策略,即基于对话轮次、历史对话等因素进行深度学习,选择概率最高的策略作为系统输出对话行为。
[0003]然而,上述的第一种方式的泛化能力弱、可扩展性低,当对话流程复杂时,会导致设计难度大、算法复杂度高,上述的第二种方法的可解释性低,而且需要大量训练数据,在真实场景下的可操作空间小,从而导致人机对话效率不高。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够有效提高人机对话效率的对话处理方法、装置、计算机设备和存储介质。
[0005]一种对话处理方法,所述方法包括:
[0006]获取当前对话文本;
[0007]根据所述当前对话文本,提取所述当前对话文本的实体;
[0008]在预设知识图谱数据库中,查询与所述实体相关的相关实体,所述预设知识图谱数据库存储有预设对话文本的预设实体,以及所述预设实体之间的预设实体关系;
[0009]根据所述实体与所述相关实体之间的实体关系,对所述实体与所述相关实体进行编码,得到所述当前对话文本对应的稠密向量;
[0010]基于所述稠密向量以及预先训练的对话模型,确定所述当前对话文本的对话结果。
[0011]在其中一个实施例中,所述根据所述当前对话文本,提取所述当前对话文本的实体,包括:
[0012]基于预先训练的实体提取模型,对所述当前对话文本进行实体提取,得到所述当前对话文本的实体。
[0013]在其中一个实施例中,所述实体提取模型的训练过程,包括:
[0014]获取标注的训练数据集,所述训练数据集中包括各训练文本,各所述训练文本标注了对应的训练实体,以及所述训练实体之间的训练实体关系;
[0015]根据所述标注的训练数据集,训练得到所述实体提取模型。
[0016]在其中一个实施例中,所述预设知识图谱数据库的建立方式,包括:
[0017]获取预设对话文本;
[0018]基于所述实体提取模型,识别所述预设对话文本的预设实体,并抽取所述预设对话文本的预设实体之间的预设实体关系;
[0019]根据所述预设实体与所述预设实体关系,创建知识图谱,将所述知识图谱存储在所述预设知识图谱数据库中,所述知识图谱的节点表示所述预设实体,所述知识图谱的路径表示所述预设实体关系。
[0020]在其中一个实施例中,所述在预设知识图谱数据库中,查询与所述实体相关的相关实体,包括:
[0021]在所述预设知识图谱数据库中,查询所述实体所在的实体节点;
[0022]按照预设路径距离,确定与所述实体节点直接相连、且符合所述预设路径距离的相关实体节点,将所述相关实体节点对应的相关实体,确定为所述相关实体。
[0023]在其中一个实施例中,所述根据所述实体与所述相关实体之间的实体关系,对所述实体与所述相关实体进行编码,得到所述当前对话文本对应的稠密向量,包括:
[0024]根据所述实体与所述相关实体之间的实体关系,将所述实体与所述相关实体转化为对应的自然语言文本;
[0025]对所述自然语言文本中的各分词进行独热编码,获得独热向量矩阵;
[0026]基于设定的编码模型,将所述独热向量矩阵转化为稠密向量,得到所述当前对话文本对应的所述稠密向量。
[0027]在其中一个实施例中,包括:
[0028]在所述当前对话文本包括至少两个实体时,所述当前对话文本对应于至少两个稠密向量,对各稠密向量进行加权并求取平均值,得到所述稠密向量;
[0029]在所述当前对话文本不包括任何实体时,将所述稠密向量设定为预设值。
[0030]在其中一个实施例中,在所述当前对话文本并非首轮对话文本时,所述基于所述稠密向量以及预先训练的对话模型,确定所述当前对话文本的对话结果,包括:
[0031]根据历史对话文本的实体,获取所述历史对话文本对应的历史稠密向量,所述历史对话文本包括上一轮对话文本;
[0032]基于所述稠密向量、所述历史稠密向量以及所述预先训练的对话模型,确定所述当前对话文本的对话结果。
[0033]一种对话处理装置,所述装置包括:
[0034]文本获取模块,用于获取当前对话文本;
[0035]实体提取模块,用于根据所述当前对话文本,提取所述当前对话文本的实体;
[0036]相关实体确定模块,用于在预设知识图谱数据库中,查询与所述实体相关的相关实体,所述预设知识图谱数据库存储有预设对话文本的预设实体,以及所述预设实体之间的预设实体关系;
[0037]编码模块,用于根据所述实体与所述相关实体之间的实体关系,对所述实体与所述相关实体进行编码,得到所述当前对话文本对应的稠密向量;
[0038]对话结果确定模块,用于基于所述稠密向量以及预先训练的对话模型,确定所述当前对话文本的对话结果。
[0039]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的对话处理方法的步骤。
[0040]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的对话处理方法的步骤。
[0041]上述对话处理方法、装置、计算机设备和存储介质,通过获取当前对话文本;根据当前对话文本,提取当前对话文本的实体;在预设知识图谱数据库中,查询与实体相关的相关实体,预设知识图谱数据库存储有预设对话文本的预设实体,以及预设实体之间的预设实体关系;根据实体与相关实体之间的实体关系,对实体与相关实体进行编码,得到当前对话文本对应的稠密向量;基于稠密向量以及预先训练的对话模型,确定当前对话文本的对话结果。采用本申请实施例的方法,通过预设知识图谱数据库,能够获得与当前对话语句相关的更多的信息,通过编码得到当前对话语句对应的稠密向量,能够避免获取大量的训练数据,并提高输出的对话结果的准确性,从而有效提高人机对话的效率。
附图说明
[0042]图1为一个实施例中对话处理方法的应用环境图;
[0043]图2为一个实施例中对话处理方法的流程示意图;
[0044]图3为一个具体实施例中建立预设知识图谱数据库的示意图;
[0045]图4为一个具体实施例中在预设知识图谱数据库中查询相关实体的示意图;
[0046]图5为一个具体实施例中得到当前对话文本对应的稠密向量的示意图;
[0047]图6为一个具体实施例中确定当前对话文本对应的稠密向量的示意图;
[0048]图7为一个具体实施例中对话处理方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话处理方法,所述方法包括:获取当前对话文本;根据所述当前对话文本,提取所述当前对话文本的实体;在预设知识图谱数据库中,查询与所述实体相关的相关实体,所述预设知识图谱数据库存储有预设对话文本的预设实体,以及所述预设实体之间的预设实体关系;根据所述实体与所述相关实体之间的实体关系,对所述实体与所述相关实体进行编码,得到所述当前对话文本对应的稠密向量;基于所述稠密向量以及预先训练的对话模型,确定所述当前对话文本的对话结果。2.根据权利要求1所述的对话处理方法,其特征在于,所述根据所述当前对话文本,提取所述当前对话文本的实体,包括:基于预先训练的实体提取模型,对所述当前对话文本进行实体提取,得到所述当前对话文本的实体。3.根据权利要求2所述的对话处理方法,其特征在于,所述实体提取模型的训练过程,包括:获取标注的训练数据集,所述训练数据集中包括各训练文本,各所述训练文本标注了对应的训练实体,以及所述训练实体之间的训练实体关系;根据所述标注的训练数据集,训练得到所述实体提取模型。4.根据权利要求2所述的对话处理方法,其特征在于,所述预设知识图谱数据库的建立方式,包括:获取预设对话文本;基于所述实体提取模型,识别所述预设对话文本的预设实体,并抽取所述预设对话文本的预设实体之间的预设实体关系;根据所述预设实体与所述预设实体关系,创建知识图谱,将所述知识图谱存储在所述预设知识图谱数据库中,所述知识图谱的节点表示所述预设实体,所述知识图谱的路径表示所述预设实体关系。5.根据权利要求1所述的对话处理方法,其特征在于,所述在预设知识图谱数据库中,查询与所述实体相关的相关实体,包括:在所述预设知识图谱数据库中,查询所述实体所在的实体节点;按照预设路径距离,确定与所述实体节点直接相连、且符合所述预设路径距离的相关实体节点,将所述相关实体节点对应的相关实体,确定为所述相关实体。6.根据权利要求5所述的对话处理方法,其特征在于,所述根据所述实体与所述相关实体之间的实体关系,对所述实体与所述相关实体进行编码,得到所述当前对话文本对应的稠密...

【专利技术属性】
技术研发人员:胡盼盼赵茜高玮李旭斐叶凯亮佟博利啟东黄深能
申请(专利权)人:零洞科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1