知识图谱的构建方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:38503039 阅读:20 留言:0更新日期:2023-08-19 16:51
本发明专利技术公开了一种知识图谱的构建方法、装置、存储介质及计算机设备,涉及保险领域,主要在于能够提高知识图谱构建的效率和精度。其中方法包括:获取与保险业务相关的保险文本;将所述保险文本输入至预设实体识别模型中进行实体识别,得到所述保险文本中包含的各个实体;从所述保险文本中确定包含所述各个实体中任意一个实体的目标文本语句,并提取所述目标文本语句对应的语句特征向量;基于所述语句特征向量,预测所述各个实体中任意两个实体之间的实体关系;基于所述各个实体对应的属性信息和所述实体关系,构建所述保险文本对应的知识图谱。本发明专利技术适用于对知识图谱进行构建。本发明专利技术适用于对知识图谱进行构建。本发明专利技术适用于对知识图谱进行构建。

【技术实现步骤摘要】
知识图谱的构建方法、装置、存储介质及计算机设备


[0001]本专利技术涉及保险领域,尤其是涉及一种知识图谱的构建方法、装置、存储介质及计算机设备。

技术介绍

[0002]保险信息推荐是对话机器人十分重要的能力,为用户推荐最为合适的保险信息对用户和企业本身都有重要意义,而对话机器人进行保险信息推荐时依赖于知识图谱,知识图谱,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,基于此,有效地构建知识图谱对于机器人的信息推荐有重要意义。
[0003]目前,通常采用人工的方式构建知识图谱。然而,这种方式需要工作人员亲自梳理知识来构建知识图谱,知识图谱构建的效率较低,与此同时,由于工作人员的业务水平参差不齐,因此不同工作人员梳理的知识可能不同,这种方式过度依赖于工作人员的经验,从而导致知识梳理的准确度较低,即对知识图谱的构建精度较低。

技术实现思路

[0004]本专利技术提供了一种知识图谱的构建方法、装置、存储介质及计算机设备,主要在于能够提高知识图谱构建的效率和精度。
[0005]根据本专利技术的第一个本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种知识图谱的构建方法,其特征在于,包括:获取与保险业务相关的保险文本;将所述保险文本输入至预设实体识别模型中进行实体识别,得到所述保险文本中包含的各个实体;从所述保险文本中确定包含所述各个实体中任意一个实体的目标文本语句,并提取所述目标文本语句对应的语句特征向量;基于所述语句特征向量,预测所述各个实体中任意两个实体之间的实体关系;基于所述各个实体对应的属性信息和所述实体关系,构建所述保险文本对应的知识图谱。2.根据权利要求1所述的方法,其特征在于,所述将所述保险文本输入至预设实体识别模型中进行实体识别,得到所述保险文本中包含的各个实体,包括:对所述保险文本中的文本语句进行分词处理,得到所述文本语句对应的各个分词;将所述各个分词输入至预设实体识别模型中进行实体识别,得到所述保险文本中包含的各个实体。3.根据权利要求2所述的方法,其特征在于,所述预设实体识别模型包括第一递归神经网络和第二递归神经网络,所述将所述各个分词输入至预设实体识别模型中进行实体识别,得到所述保险文本中包含的各个实体,包括:将所述各个分词按照其在所述保险文本中的顺序输入至第一递归神经网络中进行特征提取,得到所述各个分词共同对应的第一特征向量;将所述各个分词按照其在所述保险文本中的顺序逆序输入至第二递归神经网络中进行特征提取,得到所述各个分词共同对应的第二特征向量;将所述第一特征向量和所述第二特征向量进行合并,得到合并后的特征向量,并根据所述合并后的特征向量,确定所述各个分词对应的实体类别;基于所述实体类别,确定所述保险文本中包含的各个实体。4.根据权利要求1所述的方法,其特征在于,所述提取所述目标文本语句对应的语句特征向量,包括:确定所述目标文本语句中包含的各个字符,并根据所述各个字符在所述目标文本语句中的位置信息,确定所述各个字符对应的第三特征向量;将所述第三特征向量输入至预设特征提取模型中进行语句特征提取,得到所述目标文本语句对应的语句特征向量。5.根据权利要求4所述的方法,其特征在于,所述预设特征提取模型为预设编码器,所述预设编码器包括注意力层和前馈神经网络层,所述将所述第三特征向量输入至预设特征提取模型中进行语句特征提取,得到所述目标文本语句对应的语...

【专利技术属性】
技术研发人员:顾磊
申请(专利权)人:平安健康保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1