一种知识图谱的构建方法、装置以及电子设备制造方法及图纸

技术编号:25396840 阅读:52 留言:0更新日期:2020-08-25 23:01
本申请提供了一种知识图谱的构建方法、装置以及电子设备,其中,该方法包括:获取历史工单数据;历史工单数据包括历史订单的会话数据和/或评价数据,会话数据为历史订单在服务过程中会话服务提供方与目标对象之间的会话数据,目标对象包括订单服务提供方和/或订单服务请求方;基于历史工单数据的工单标题确定工单路径;基于工单路径中提取实体关系,并基于实体关系构建目标知识图谱;其中,实体关系表示工单路径中不同层级的路径中节点实体之间的关系,节点实体为多级子标题。本申请通过历史工单数据的工单标题确定工单路径,进而根据工单路径构建知识图谱的方式,提高了知识图谱的构建效率,提高了知识图谱的准确性。

【技术实现步骤摘要】
一种知识图谱的构建方法、装置以及电子设备
本申请涉及数据处理的
,具体而言,涉及一种知识图谱的构建方法、装置以及电子设备。
技术介绍
目前,传统网约车平台的智能客服系统在实现和用户之间的对话时是基于智能知识库来实现的,因此,智能知识库中知识点的全面性和准确性直接影响对话机器人的服务效果。在传统的智能知识库中,由于知识点的组织结构不同,并且分类格式不统一,知识点的管理存在困难。因此,可以利用知识图谱为智能知识库的管理与新知识点的校验进行辅助。从知识图谱的构建上而言,主要的构建方法分为自定而下的人工构建和自下而上的自动化构建方法。人工构建方法通过领域专家构建合理的实体和关系,并人工的构建知识图谱;而自动化构建方法则通过访问百科类数据,通过命名实体识别、关系抽取、实体对齐等手段构建知识图谱。针对于知识图谱的构建而言,人工构建的方法可以保证知识图谱需要大量的人工投入;自动化的构建方法构建知识图谱的质量较低,需要进行人工校验。因此,上述传统的知识图谱的构建方法效率低,准确性差,这将导致智能知识库的结构混乱,精准度差,将影响用户的满意程度。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种知识图谱的构建方法、装置以及电子设备。本申请通过历史工单数据的工单标题确定工单路径,进而根据工单路径构建知识图谱的方式,提高了知识图谱的构建效率,提高了知识图谱的准确性。根据本申请的一个方面,提供一种电子设备,可以包括一个或多个存储介质和一个或多个与存储介质通信的处理器。一个或多个存储介质存储有处理器可执行的机器可读指令。当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行所述机器可读指令,以执行一个或多个以下操作:获取历史工单数据;所述历史工单数据包括历史订单的会话数据和/或评价数据,会话数据为历史订单在服务过程中会话服务提供方与目标对象之间的会话数据,所述目标对象包括订单服务提供方和/或订单服务请求方;基于所述历史工单数据的工单标题确定工单路径;其中,所述工单标题表示会话数据的会话场景信息,且所述工单标题中包含多级子标题,所述工单路径表示各级子标题之间的层级关系;基于所述工单路径中提取实体关系,并基于所述实体关系构建目标知识图谱;其中,所述实体关系表示所述工单路径中不同层级的路径中节点实体之间的关系,所述节点实体为多级子标题。在本申请较佳的实施例中,所述工单标题为多个;基于所述历史工单数据的工单标题确定工单路径包括:获取每个所述工单标题中各级子标题的层级信息;基于每个所述工单标题中各级子标题的层级信息构建目标多叉树;并将所述目标多叉树中各个节点的路径信息确定为所述工单路径,其中,所述目标多叉树中的各个节点为所述多级子标题。在本申请较佳的实施例中,基于所述工单标题中各级子标题的层级信息构建目标多叉树包括:基于所述层级信息将多个所述工单标题进行合并,得到初始多叉树,其中,多个所述工单标题中位于同一层级且名称相同的子标题合并为一个子标题;对所述初始多叉树中的节点实体进行合并处理,得到所述目标多叉树。在本申请较佳的实施例中,对所述初始多叉树中的节点实体进行合并处理,得到所述目标多叉树包括:基于所述工单标题所对应的会话数量对所述初始多叉树中的节点实体进行合并处理,得到所述目标多叉树。在本申请较佳的实施例中,基于所述工单标题所对应的会话数量对所述初始多叉树中的节点实体进行合并处理,得到所述目标多叉树包括:反复执行下述步骤,直至待合并节点实体的层级数大于或者等于预设层级数:将所述初始多叉树中节点实体Ai作为所述待合并节点实体;i大于或者等于所述预设层级数;获取所述初始多叉树中节点实体Ai所对应的会话数量;若所述会话数量小于预设阈值,则将所述节点实体Ai和节点实体Ai-1进行合并;并将节点实体Ai-1作为待合并节点实体,所述节点实体Ai-1为所述节点实体Ai所属的上一层级的节点。在本申请较佳的实施例中,所述工单路径的数量为多个;基于所述工单路径中提取实体关系包括:在每条所述工单路径中提取任意两个相邻的节点实体,以及提取所述任意两个相邻的节点实体之间的层级关系;将所述任意两个相邻的节点实体及其层级关系确定为所述实体关系。在本申请较佳的实施例中,所述实体关系为三元组数据,其中,所述三元组数据中包括的元素包括:所述任意两个相邻的节点实体的名称信息、所述任意两个相邻的节点实体之间的层级关系。在本申请较佳的实施例中,基于所述实体关系构建目标知识图谱包括:获取目标知识点;所述目标知识点包含提问信息和所述提问信息的回答信息;结合所述目标知识点和所述实体关系构建所述目标知识图谱。在本申请较佳的实施例中,结合所述目标知识点和所述实体关系构建所述目标知识图谱包括:对所述目标知识点进行分词处理,得到分词序列,其中,所述分词序列中包含至少一个分词;将所述分词序列中的各个分词和各个节点实体进行匹配;若所述分词序列中包含和所述各个节点实体相匹配的目标分词,则构建所述目标分词和所述实体关系之间的关联关系;基于所述关联关系和所述实体关系构建所述目标知识图谱。在本申请较佳的实施例中,所述关联关系为三元组数据,所述三元组数据中包括以下元素:所述目标分词的名称信息,所述目标知识点,所述目标分词和所述目标知识点之间的所属关系。在本申请较佳的实施例中,基于所述关联关系和所述实体关系构建所述目标知识图谱包括:将所述关联关系和所述实体关系映射为知识图谱,并将映射得到的知识图谱作为所述目标知识图谱。在本申请较佳的实施例中,所述方法还包括:若所述分词序列中包含和所述各个节点实体相匹配的目标分词,则向用户发送校验信息,以提示用户校验所述目标知识点是否属于所述目标分词;若获取到的校验结果为校验通过,则构建所述目标分词和所述实体关系之间的关联关系。根据本申请的另一个方面,还提供了一种知识图谱的构建装置,包括:获取单元,用于获取历史工单数据;所述历史工单数据包括历史订单的会话数据和/或评价数据,会话数据为历史订单在服务过程中会话服务提供方与目标对象之间的会话数据,所述目标对象包括订单服务提供方和/或订单服务请求方;确定单元,用于基于所述历史工单数据的工单标题确定工单路径;其中,所述工单标题表示会话数据的会话场景信息,且所述工单标题中包含多级子标题,所述工单路径表示各级子标题之间的层级关系;提取构建单元,用于基于所述工单路径中提取实体关系,并基于所述实体关系构建目标知识图谱;其中,所述实体关系表示所述工单路径中不同层级的路径中节点实体之间的关系,所述节点实体为多级子标题。在本申请较佳的实施例中,所述工单标题为多个;所述确定单元包括:第一获取模块,用于获取每个所述工单标题中各级子标题的层级信息;第一构建模块,用于基于每个所述工单标题中各级子标题的层级信息构建目标多叉树;第一确定模块,用于将所述目标多叉树中各个节点的路径信息确定为所述工单路径,其中,所述目标多叉树中的各个节点为所述多级子标题。在本申请较佳的实施例中,所述构建模块用于:基于所述层级信息将多个所述工单标题本文档来自技高网...

【技术保护点】
1.一种知识图谱的构建方法,其特征在于,包括:/n获取历史工单数据;所述历史工单数据包括历史订单的会话数据和/或评价数据,会话数据为历史订单在服务过程中会话服务提供方与目标对象之间的会话数据,所述目标对象包括订单服务提供方和/或订单服务请求方;/n基于所述历史工单数据的工单标题确定工单路径;其中,所述工单标题表示会话数据的会话场景信息,且所述工单标题中包含多级子标题,所述工单路径表示各级子标题之间的层级关系;/n基于所述工单路径中提取实体关系,并基于所述实体关系构建目标知识图谱;其中,所述实体关系表示所述工单路径中不同层级的路径中节点实体之间的关系,所述节点实体为多级子标题。/n

【技术特征摘要】
1.一种知识图谱的构建方法,其特征在于,包括:
获取历史工单数据;所述历史工单数据包括历史订单的会话数据和/或评价数据,会话数据为历史订单在服务过程中会话服务提供方与目标对象之间的会话数据,所述目标对象包括订单服务提供方和/或订单服务请求方;
基于所述历史工单数据的工单标题确定工单路径;其中,所述工单标题表示会话数据的会话场景信息,且所述工单标题中包含多级子标题,所述工单路径表示各级子标题之间的层级关系;
基于所述工单路径中提取实体关系,并基于所述实体关系构建目标知识图谱;其中,所述实体关系表示所述工单路径中不同层级的路径中节点实体之间的关系,所述节点实体为多级子标题。


2.根据权利要求1所述的方法,其特征在于,所述工单标题为多个;基于所述历史工单数据的工单标题确定工单路径包括:
获取每个所述工单标题中各级子标题的层级信息;
基于每个所述工单标题中各级子标题的层级信息构建目标多叉树;并将所述目标多叉树中各个节点的路径信息确定为所述工单路径,其中,所述目标多叉树中的各个节点为所述多级子标题。


3.根据权利要求2所述的方法,其特征在于,基于所述工单标题中各级子标题的层级信息构建目标多叉树包括:
基于所述层级信息将多个所述工单标题进行合并,得到初始多叉树,其中,多个所述工单标题中位于同一层级且名称相同的子标题合并为一个子标题;
对所述初始多叉树中的节点实体进行合并处理,得到所述目标多叉树。


4.根据权利要求3所述的方法,其特征在于,对所述初始多叉树中的节点实体进行合并处理,得到所述目标多叉树包括:
基于所述工单标题所对应的会话数量对所述初始多叉树中的节点实体进行合并处理,得到所述目标多叉树。


5.根据权利要求4所述的方法,其特征在于,基于所述工单标题所对应的会话数量对所述初始多叉树中的节点实体进行合并处理,得到所述目标多叉树包括:
反复执行下述步骤,直至待合并节点实体的层级数大于或者等于预设层级数:
将所述初始多叉树中节点实体Ai作为所述待合并节点实体;i大于或者等于所述预设层级数;
获取所述初始多叉树中节点实体Ai所对应的会话数量;
若所述会话数量小于预设阈值,则将所述节点实体Ai和节点实体Ai-1进行合并;并将节点实体Ai-1作为待合并节点实体,所述节点实体Ai-1为所述节点实体Ai所属的上一层级的节点。


6.根据权利要求1所述的方法,其特征在于,所述工单路径的数量为多个;基于所述工单路径中提取实体关系包括:
在每条所述工单路径中提取任意两个相邻的节点实体,以及提取所述任意两个相邻的节点实体之间的层级关系;
将所述任意两个相邻的节点实体及其层级关系确定为所述实体关系。


7.根据权利要求6所述的方法,其特征在于,所述实体关系为三元组数据,其中,所述三元组数据中包括的元素包括:所述任意两个相邻的节点实体的名称信息、所述任意两个相邻的节点实体之间的层级关系。


8.根据权利要求1所述的方法,其特征在于,基于所述实体关系构建目标知识图谱包括:
获取目标知识点;所述目标知识点包含提问信息和所述提问信息的回答信息;
结合所述目标知识点和所述实体关系构建所述目标知识图谱。


9.根据权利要求8所述的方法,其特征在于,结合所述目标知识点和所述实体关系构建所述目标知识图谱包括:
对所述目标知识点进行分词处理,得到分词序列,其中,所述分词序列中包含至少一个分词;
将所述分词序列中的各个分词和各个节点实体进行匹配;
若所述分词序列中包含和所述各个节点实体相匹配的目标分词,则构建所述目标分词和所述实体关系之间的关联关系;
基于所述关联关系和所述实体关系构建所述目标知识图谱。


10.根据权利要求9所述的方法,其特征在于,所述关联关系为三元组数据,所述三元组数据中包括以下元素:所述目标分词的名称信息,所述目标知识点,所述目标分词和所述目标知识点之间的所属关系。


11.根据权利要求10所述的方法,其特征在于,基于所述关联关系和所述实体关系构建所述目标知识图谱包括:
将所述关联关系和所述实体关系映射为知识图谱,并将映射得到的知识图谱作为所述目标知识图谱。


12.根据权利要求10所述的方法,其特征在于,所述方法还包括:
若所述分词序列中包含和所述各个节点实体相匹配的目标分词,则向用户发送校验信息,以提示用户校验所述目标知识点是否属于所述目标分词;
若获取到的校验结果为校验通过,则构建所述目标分词和所述实体关系之间的关联关系。


13.一种知识图谱的构建装置,其特征在于,包括:
获取单元,用于获取历史工单数据;所述历史工单数据包括历史订单的会话数据和/或评价数据,会话数据为历史订单在服务过程中会话服务提供方与目...

【专利技术属性】
技术研发人员:刘纯一柳俊宏薛艳云王鹏李奘
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1