基于知识图谱的数据模型构建方法、装置、设备和介质制造方法及图纸

技术编号:30333028 阅读:16 留言:0更新日期:2021-10-10 00:53
本公开的实施例公开了基于知识图谱的数据模型构建方法、装置、设备和介质。该方法的一具体实施方式包括:对目标表对应的各个数据结构信息接口进行解析,得到解析后的目标表的数据结构文本集合;对数据结构文本集合中的各个数据结构文本进行三元组映射处理,得到实体内三元组集合和第一实体间三元组集合;响应于存在与目标表的语义关系满足预设语义关系条件的表,对于与目标表的语义关系满足预设语义关系条件的每个表,根据目标表、表和语义关系,生成第二实体间三元组集合;将实体内三元组集合、第一实体间三元组集合和所得到的第二实体间三元组集合存储至资源描述框架文件。该实施方式可以识别较多的语义关系,提升了搜索结果的深度和广度。的深度和广度。的深度和广度。

【技术实现步骤摘要】
基于知识图谱的数据模型构建方法、装置、设备和介质


[0001]本公开的实施例涉及计算机
,具体涉及基于知识图谱的数据模型构建方法、装置、设备和介质。

技术介绍

[0002]数据模型是数据特征的抽象,通常利用数据模型,构建全局的数据架构、数据流向及数据全景图。目前,在对数据模型进行构建时,通常采用的方式为:通过数据资源目录方式或实体

联系图方式构建数据模型。
[0003]然而,当采用上述方式对数据模型进行构建时,经常会存在如下技术问题:仅能表达数据模型语义层面的“上下”、“主从”关系,不能表示其他语义层面的关系,例如“相似”等,造成数据模型语义失联、难以识别语义关系;且仅支持对数据模型的精准搜索,不支持模糊搜索,搜索结果单一,缺乏深度和广度。

技术实现思路

[0004]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]本公开的一些实施例提出了基于知识图谱的数据模型构建方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题。
[0006]第一方面,本公开的一些实施例提供了一种基于知识图谱的数据模型构建方法,该方法包括:对目标表对应的各个数据结构信息接口进行解析,得到解析后的上述目标表的数据结构文本集合,其中,上述各个数据结构信息接口对应数据库集合,上述目标表存储在上述数据库集合中;对上述数据结构文本集合中的各个数据结构文本进行三元组映射处理,得到实体内三元组集合和第一实体间三元组集合;响应于存在与上述目标表的语义关系满足预设语义关系条件的表,对于与上述目标表的语义关系满足上述预设语义关系条件的每个表,根据上述目标表、上述表和上述语义关系,生成第二实体间三元组集合;将上述实体内三元组集合、上述第一实体间三元组集合和所得到的第二实体间三元组集合存储至资源描述框架文件。
[0007]可选地,方法还包括:响应于接收到对于上述目标表的数据模型浏览请求,根据上述资源描述框架文件,在相关联的显示设备中以网络图的形式展示上述目标表的数据模型图谱。
[0008]可选地,在上述对目标表对应的各个数据结构信息接口进行解析,得到解析后的上述目标表的数据结构文本集合之前,方法还包括:对于上述数据库集合中的每个数据库,从上述数据库中获取上述目标表的数据结构信息,以及将上述数据结构信息存储至上述数据库对应的目标文件中;对于上述数据库集合中的每个数据库,将上述数据库对应的存储了数据结构信息的目标文件封装为数据结构信息接口。
[0009]可选地,在上述对于上述数据库集合中的每个数据库,将上述数据库对应的存储了数据结构信息的目标文件封装为数据结构信息接口之前,方法还包括:对存储了数据结构信息的各个目标文件进行标准化处理。
[0010]可选地,上述将上述数据结构信息存储至上述数据库对应的目标文件,还包括:将上述数据库对应的数据库信息存储至上述目标文件。
[0011]可选地,在上述响应于存在与上述目标表的语义关系满足预设语义关系条件的表,对于与上述目标表的语义关系满足上述预设语义关系条件的每个表,根据上述目标表、上述表和上述语义关系,生成第二实体间三元组集合之前,方法还包括:基于预设的表集合中的每个表的描述信息和上述目标表的描述信息,生成语义相似度,以及确定上述语义相似度对应的语义关系。
[0012]第二方面,本公开的一些实施例提供了一种基于知识图谱的数据模型构建装置,装置包括:解析单元,被配置成对目标表对应的各个数据结构信息接口进行解析,得到解析后的上述目标表的数据结构文本集合,其中,上述各个数据结构信息接口对应数据库集合,上述目标表存储在上述数据库集合中;映射单元,被配置成对上述数据结构文本集合中的各个数据结构文本进行三元组映射处理,得到实体内三元组集合和第一实体间三元组集合;生成单元,被配置成响应于存在与上述目标表的语义关系满足预设语义关系条件的表,对于与上述目标表的语义关系满足上述预设语义关系条件的每个表,根据上述目标表、上述表和上述语义关系,生成第二实体间三元组集合;存储单元,被配置成将上述实体内三元组集合、上述第一实体间三元组集合和所得到的第二实体间三元组集合存储至资源描述框架文件。
[0013]可选地,装置还包括:展示单元,被配置成响应于接收到对于上述目标表的数据模型浏览请求,根据上述资源描述框架文件,在相关联的显示设备中以网络图的形式展示上述目标表的数据模型图谱。
[0014]可选地,在解析单元之前,装置还包括:获取单元和封装单元。其中,获取单元被配置成对于上述数据库集合中的每个数据库,从上述数据库中获取上述目标表的数据结构信息,以及将上述数据结构信息存储至上述数据库对应的目标文件中。封装单元被配置成将上述数据库对应的存储了数据结构信息的目标文件封装为数据结构信息接口。
[0015]可选地,在封装单元之前,装置还包括:标准化处理单元,被配置成对存储了数据结构信息的各个目标文件进行标准化处理。
[0016]可选地,存储单元还包括:数据库信息存储单元,被配置成将上述数据库对应的数据库信息存储至上述目标文件。
[0017]可选地,在生成单元之前,装置还包括:语义相似度生成单元,被配置成基于预设的表集合中的每个表的描述信息和上述目标表的描述信息,生成语义相似度,以及确定上述语义相似度对应的语义关系。
[0018]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
[0019]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
[0020]本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的基于知识图谱的数据模型构建方法,可以识别较多的语义关系,提升了搜索结果的深度和广度。具体来说,造成数据模型语义失联、难以识别语义关系以及搜索结果缺乏深度和广度的原因在于:仅能表达数据模型语义层面的“上下”、“主从”关系,不能表示其他语义层面的关系,例如“相似”等,造成数据模型语义失联、难以识别语义关系;且仅支持对数据模型的精准搜索,不支持模糊搜索,搜索结果单一,缺乏深度和广度。基于此,本公开的一些实施例的基于知识图谱的数据模型构建方法,首先,对目标表对应的各个数据结构信息接口进行解析,得到解析后的上述目标表的数据结构文本集合。其中,上述各个数据结构信息接口对应数据库集合,上述目标表存储在上述数据库集合中。由此,可以从在先封装的各个数据结构信息接口中解析得到目标表的数据结构文本集合。然后,对上述数据结构文本集合中的各个数据结构文本进行三元组映射处理,得到实体内三元组集合和第一实体间三元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的数据模型构建方法,包括:对目标表对应的各个数据结构信息接口进行解析,得到解析后的所述目标表的数据结构文本集合,其中,所述各个数据结构信息接口对应数据库集合,所述目标表存储在所述数据库集合中;对所述数据结构文本集合中的各个数据结构文本进行三元组映射处理,得到实体内三元组集合和第一实体间三元组集合;响应于存在与所述目标表的语义关系满足预设语义关系条件的表,对于与所述目标表的语义关系满足所述预设语义关系条件的每个表,根据所述目标表、所述表和所述语义关系,生成第二实体间三元组集合;将所述实体内三元组集合、所述第一实体间三元组集合和所得到的第二实体间三元组集合存储至资源描述框架文件。2.根据权利要求1所述的方法,其中,所述方法还包括:响应于接收到对于所述目标表的数据模型浏览请求,根据所述资源描述框架文件,在相关联的显示设备中以网络图的形式展示所述目标表的数据模型图谱。3.根据权利要求1所述的方法,其中,在所述对目标表对应的各个数据结构信息接口进行解析,得到解析后的所述目标表的数据结构文本集合之前,所述方法还包括:对于所述数据库集合中的每个数据库,从所述数据库中获取所述目标表的数据结构信息,以及将所述数据结构信息存储至所述数据库对应的目标文件中;对于所述数据库集合中的每个数据库,将所述数据库对应的存储了数据结构信息的目标文件封装为数据结构信息接口。4.根据权利要求3所述的方法,其中,在所述对于所述数据库集合中的每个数据库,将所述数据库对应的存储了数据结构信息的目标文件封装为数据结构信息接口之前,所述方法还包括:对存储了数据结构信息的各个目标文件进行标准化处理。5.根据权利要求3所述的方法,其中,所述将所述数据结构信息存储至所述数据库对应的目标文件,还包括:将所述数据库对应的数据库信息存储至所述目标文件。6.根据权利要求1所述的方法,其中,在所述...

【专利技术属性】
技术研发人员:刘林
申请(专利权)人:北京京东振世信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1