【技术实现步骤摘要】
一种基于知识图谱的数据管理方法、系统、设备和介质
本专利技术涉及数据处理领域,尤其涉及一种基于知识图谱的数据管理方法、系统、设备和介质。
技术介绍
知识图谱在各个领域得到广泛应用,知识图谱虽然可以直观展示实体信息之间的关联性,但是在数据量较大时,知识图谱中包含的信息过于庞杂,信息检索计算量大,复杂度高,难以快速高效的从知识图谱中获取需要的信息。此外,知识图谱中关联关系的建立依赖于关联规则,信息关联准确性难以保障,常会出现误关联或漏关联,缺乏有效的校验反馈。如何有效利用知识图谱中的数据信息成为目前一大难题。
技术实现思路
鉴于以上现有技术存在的问题,本专利技术提出一种基于知识图谱的数据管理方法、系统、设备和介质,主要解决现有知识图谱计算复杂度高,数据处理效率低不便于细分管理的问题。为了实现上述目的及其他目的,本专利技术采用的技术方案如下。一种基于知识图谱的数据管理方法,包括:根据指定领域内的记录数据构建知识图谱;根据设置的关键词从所述知识图谱中获取知识原子,建立基于关键词的知 ...
【技术保护点】
1.一种基于知识图谱的数据管理方法,其特征在于,包括:/n根据指定领域内的记录数据构建知识图谱;/n根据设置的关键词从所述知识图谱中获取知识原子,建立基于关键词的知识原子数据集,其中所述知识原子包含与所述关键词关联的多个实体数据和/或关系数据;/n所述知识图谱更新后,将所述知识原子与知识图谱进行比对,获取新增的实体数据和/或关系数据,并输出至校验终端,根据所述校验终端反馈结果,判断是否将所述新增的实体数据和/或关系数据更新到对应的知识原子中。/n
【技术特征摘要】
1.一种基于知识图谱的数据管理方法,其特征在于,包括:
根据指定领域内的记录数据构建知识图谱;
根据设置的关键词从所述知识图谱中获取知识原子,建立基于关键词的知识原子数据集,其中所述知识原子包含与所述关键词关联的多个实体数据和/或关系数据;
所述知识图谱更新后,将所述知识原子与知识图谱进行比对,获取新增的实体数据和/或关系数据,并输出至校验终端,根据所述校验终端反馈结果,判断是否将所述新增的实体数据和/或关系数据更新到对应的知识原子中。
2.根据权利要求1所述的基于知识图谱的数据管理方法,其特征在于,根据指定领域内的记录数据构建知识图谱,包括:
获取所述记录数据中的实体-关系-实体或实体-关系-属性三元组,根据三元组数据构建初始图谱,
根据预设的评分函数对所述初始图谱中的实体或关系之间的相似度进行评分,并将分数达到阈值且未建立连接的实体进行关联,更新所述初始图谱得到构建的知识图谱。
3.根据权利要求1所述的基于知识图谱的数据管理方法,其特征在于,根据设置的关键词从所述知识图谱中获取知识原子,建立基于关键词的知识原子数据集,包括:
获取对应领域的标准词,构建标准词数据集,并以标准词为关键词,计算所述知识图谱中实体数据与所述关键词的相似度,获取匹配的实体数据;
设置待获取知识原子的深度信息,以所述匹配的实体数据为中心从所述知识图谱中获取满足所述深度信息的知识原子。
4.根据权利要求3所述的基于知识图谱的数据管理方法,其特征在于,所述深度信息表示为:
以与所述匹配的实体数据连接的实体数据为第一深度数据;与所述第一深度数据连接的实体数据为第二深度数据,以此确定多级深度数据;
为每一级深度数据分配一固定的深度值,通过设置深度信息匹配深度值,调整所述知识原子的覆盖范围。
5.根据权利要求3所述的基于知识图谱的数据管理方法,其特征在于,当匹配的实体数据为多个时,计算每个匹配的实体数据对应的知识原子与对应关键词的综合相似度,选择综合相似度最高的知识原子作...
【专利技术属性】
技术研发人员:姚娟娟,樊代明,钟南山,
申请(专利权)人:明品云北京数据科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。