知识图谱本体更新方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:27059276 阅读:16 留言:0更新日期:2021-01-15 14:39
本发明专利技术涉及大数据技术领域,公开了一种知识图谱本体更新方法、装置、计算机设备及存储介质,用于更新知识图谱的本体中的实例,包括:获取至少一个待更新实体;获取知识图谱中实例与所述待更新实体相似的相似本体,识别与所述待更新实体相似度最高的相似本体并将其设为目标本体;将所述待更新实体作为所述目标本体的新增实例载入所述目标本体,以更新所述目标本体。本发明专利技术还涉及区块链技术,信息可存储于区块链节点中。本发明专利技术不仅实现了自动识别待更新实体所属目标本体的作用,而且还降低了目标本体识别作业的计算负担,同时还保证了目标本体识别的准确度,提高了本体更新速度及效率,因此,避免了本体更新缓慢,效率低下,人工成本高的问题。

【技术实现步骤摘要】
知识图谱本体更新方法、装置、计算机设备及存储介质
本专利技术涉及大数据的数据分析
,尤其涉及一种知识图谱本体更新方法、装置、计算机设备及存储介质。
技术介绍
知识图谱(KnowledgeGraph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。在知识图谱中,本体(ontology)作为构建图谱的概念集合或概念框架以概念性质的上位单元在知识图谱中存在,如“疾病”、“产品”、“职业”等。而实例作为本体中的下位单元从属于该本体的概念下存在,如:“感冒”、“F人保”、“工程师”等。然而,专利技术人发现,当前知识图谱的本体更新,也就是在本体中新增实例的工作,主要采用人工编辑的方式手动构建(如现有的本体编辑软件),因此造成工作量巨大,导致本体更新缓慢,效率低下,人工成本高的问题。
技术实现思路
本专利技术的目的是提供一种知识图谱本体更新方法、装置、计算机设备及存储介质,用于解决现有技术存在的因当前知识图谱人工编辑的方式手动构建,导致造成工作量巨大,本体更新缓慢,效率低下,人工成本高的问题。本申请可应用于智慧医疗场景中,从而推动智慧城市的建设。为实现上述目的,本专利技术提供一种知识图谱本体更新方法,用于更新知识图谱的本体中的实例,包括:获取至少一个待更新实体;获取知识图谱中实例与所述待更新实体相似的相似本体,识别与所述待更新实体相似度最高的相似本体并将其设为目标本体;将所述待更新实体作为所述目标本体的新增实例载入所述目标本体,以更新所述目标本体。上述方案中,所述获取至少一个待更新实体之后,所述方法还包括:提取所述知识图谱中各本体的实例,识别各所述实例中与所述待更新实体相似的实例并将其设为相似实例,及将所述相似实例对应的本体设为相似本体。上述方案中,所述识别各所述实例中与所述待更新实体相似的实例并将其设为相似实例的步骤,包括:从知识图谱中的各本体中提取预置数量的实例;计算所述待更新实体与各所述实例之间的相似度得到下位相似值;判定与所述待更新实体之间下位相似值低于预置相似实例阈值的实例为相似实例。上述方案中,所述计算所述待更新实体与各所述实例之间的相似度得到下位相似值的步骤,包括:通过第一相似度模型计算所述待更新实体的待更新特征,与所述实例的实例特征之间的距离,并将该距离作为反映待更新实体与各实例之间相似度的下位相似值,其中,所述第一相似度模型是基于聚类算法通过距离算法或余弦相似度算法所述计算待更新特征和所述实例特征之间的距离,得到待更新实体和实例之间相似程度的计算机模型,所述待更新特征是以向量形式反映所述待更新实体含义的数据,所述实例特征是以向量形式反映所述实例含义的数据。上述方案中,所述识别与所述待更新实体相似度最高的相似本体并将其设为目标本体的步骤,包括:计算所述待更新实体与所述相似本体中各实例之间的具体相似值;根据预置的上位公式对所述具体相似值进行加权运算或平均值运算,得到用于反映所述待更新实体与该相似本体的类之间相似程度的上位相似值;判定值最低的所述上位相似值所对应的相似本体为目标本体;所述判定值最低的上位相似值所对应的相似本体为目标本体之后,所述方法还包括:将所述目标本体上传至区块链中。上述方案中,所述计算所述待更新实体与所述相似本体中各实例之间的具体相似值的步骤,包括:通过第二相似度模型计算待更新实体的待更新特征,与所述相似本体中各实例的实例特征之间的距离,并将该距离作为反映所述待更新实体与所述相似本体中各实例之间的具体相似值,其中,所述第二相似度模型是基于聚类算法通过距离算法或余弦相似度算法计算所述待更新特征和所述实例特征,得到具体相似值的计算机模型,所述待更新特征是以向量形式反映所述待更新实体含义的数据,所述实例特征是以向量形式反映所述实例含义的数据。上述方案中,所述将所述待更新实体作为所述目标本体的新增实例载入所述目标本体之后,以更新所述目标本体,还包括:提取所述目标本体的公理,所述公理的种类包括所述目标本体中各实例之间的第一关联关系,和各实例与所述目标本体的类之间的第二关联关系;判断所述公理的种类;若所述种类为所述第一关联关系,则根据所述第一关联关系使所述新增实例与所述目标本体中各实例之间建立关联关系;若所述种类为所述第二关联关系,则根据所述第二关联关系使所述新增实例与所述目标本体的类之间建立关联关系。为实现上述目的,本专利技术还提供一种知识图谱本体更新装置,包括:实体获取模块,用于获取至少一个待更新实体;目标识别模块,用于获取知识图谱中实例与所述待更新实体相似的相似本体,识别与所述待更新实体相似度最高的相似本体并将其设为目标本体;本体更新模块,用于将所述待更新实体作为所述目标本体的新增实例载入所述目标本体,以更新所述目标本体。为实现上述目的,本专利技术还提供一种计算机设备,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述计算机设备的处理器执行所述计算机程序时实现上述知识图谱本体更新方法的步骤。为实现上述目的,本专利技术还提供一种计算机存储介质,所述存储介质上存储有计算机程序,所述存储介质存储的所述计算机程序被处理器执行时实现上述知识图谱本体更新方法的步骤。本专利技术提供的知识图谱本体更新方法、装置、计算机设备及存储介质,通过将与相似实例对应的本体设为相似本体,再从这些相似本体中获取更多的实例,以进行待更新实体与相似本体之间进一步的精细化相似度比对,不仅实现了自动识别待更新实体所属目标本体的作用,而且还降低了目标本体识别作业的计算负担,同时还保证了目标本体识别的准确度。通过将待更新本体作为目标本体的新增实例,载入所述目标本体中,进而实现更新目标本体的技术效果,提高了本体更新速度及效率,避免了人工识别标注本体,因此,避免了当前因采用人工对待更新实体进行本体识别及标注,导致本体更新缓慢,效率低下,人工成本高的问题。附图说明图1为本专利技术知识图谱本体更新方法实施例一的流程图;图2为本专利技术知识图谱本体更新方法实施例二中知识图谱本体更新方法的环境应用示意图;图3是本专利技术知识图谱本体更新方法实施例二中知识图谱本体更新方法的具体方法流程图;图4是本专利技术知识图谱本体更新方法实施例二中识别各所述实例中与所述待更新实体相似的实例并将其设为相似实例的具体方法流程图;图5是本专利技术知识图谱本体更新方法实施例二中识别与所述待更新实体相似度最高的相似本体并将其设为目标本体的具体方法流程图;图6为本专利技术知识图谱本体更新装置实施例三的程序模块示意图;图7为本专利技术计算机设备实施例四中计算机设备的硬件结构示意图。具体实施方式为了使本专利技术的目的、技本文档来自技高网...

【技术保护点】
1.一种知识图谱本体更新方法,用于更新知识图谱的本体中的实例,其特征在于,包括:/n获取至少一个待更新实体;/n获取知识图谱中实例与所述待更新实体相似的相似本体,识别与所述待更新实体相似度最高的相似本体并将其设为目标本体;/n将所述待更新实体作为所述目标本体的新增实例载入所述目标本体,以更新所述目标本体。/n

【技术特征摘要】
1.一种知识图谱本体更新方法,用于更新知识图谱的本体中的实例,其特征在于,包括:
获取至少一个待更新实体;
获取知识图谱中实例与所述待更新实体相似的相似本体,识别与所述待更新实体相似度最高的相似本体并将其设为目标本体;
将所述待更新实体作为所述目标本体的新增实例载入所述目标本体,以更新所述目标本体。


2.根据权利要求1所述的知识图谱本体更新方法,其特征在于,所述获取至少一个待更新实体之后,所述方法还包括:
提取所述知识图谱中各本体的实例,识别各所述实例中与所述待更新实体相似的实例并将其设为相似实例,及将所述相似实例对应的本体设为相似本体。


3.根据权利要求2所述的知识图谱本体更新方法,其特征在于,所述识别各所述实例中与所述待更新实体相似的实例并将其设为相似实例的步骤,包括:
从知识图谱中的各本体中提取预置数量的实例;
计算所述待更新实体与各所述实例之间的相似度得到下位相似值;
判定与所述待更新实体之间下位相似值低于预置相似实例阈值的实例为相似实例。


4.根据权利要求3所述的知识图谱本体更新方法,其特征在于,所述计算所述待更新实体与各所述实例之间的相似度得到下位相似值的步骤,包括:
通过第一相似度模型计算所述待更新实体的待更新特征,与所述实例的实例特征之间的距离,并将该距离作为反映待更新实体与各实例之间相似度的下位相似值,其中,所述第一相似度模型是基于聚类算法通过距离算法或余弦相似度算法所述计算待更新特征和所述实例特征之间的距离,得到待更新实体和实例之间相似程度的计算机模型,所述待更新特征是以向量形式反映所述待更新实体含义的数据,所述实例特征是以向量形式反映所述实例含义的数据。


5.根据权利要求1所述的知识图谱本体更新方法,其特征在于,所述识别与所述待更新实体相似度最高的相似本体并将其设为目标本体的步骤,包括:
计算所述待更新实体与所述相似本体中各实例之间的具体相似值;
根据预置的上位公式对所述具体相似值进行加权运算或平均值运算,得到用于反映所述待更新实体与该相似本体的类之间相似程度的上位相似值;
判定值最低的所述上位相似值所对应的相似本体为目标本体;
所述判定值最低的上位相似值所对应的相似本体...

【专利技术属性】
技术研发人员:梁志成
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1