一种化学品知识图数据库的构建方法及其构建装置制造方法及图纸

技术编号:38943459 阅读:18 留言:0更新日期:2023-09-25 09:41
本发明专利技术提供了一种化学品知识图数据库的构建方法及其构建装置。该存储方法包括以下步骤:从数据源获取涉及化学品知识的多条字段信息;根据知识图谱中的本体定义和本体约束,获取各该字段信息所对应的由语义三元组表示的映射配置记录;将各该映射配置记录与该数据源进行数据链接,以将各该映射配置记录分别转化为连接该数据源的数据三元组;以及基于连接该数据源的数据三元组,构建该化学品知识图数据库。通过实施上述构建方法,能够融合不同来源、不同样式的危险化学品的信息数据,打破数据之间的壁垒,从而提供更加简洁有效的访问入口,高效地获取危险化学品信息,以便更好地为用户提供信息服务与辅助决策。提供信息服务与辅助决策。提供信息服务与辅助决策。

【技术实现步骤摘要】
一种化学品知识图数据库的构建方法及其构建装置


[0001]本专利技术涉及信息集成、数据融合及知识图谱等
,尤其涉及一种化学品知识图数据库的构建方法、一种化学品知识图数据库的构建装置以及一种计算机可读存储介质。

技术介绍

[0002]由于化工产业全流程涉及大量危险化学品,且种类繁多,特性各异。危险化学品的生产、运输、存储与使用的每一个环节存在安全隐患,都可能导致生命财产安全受到威胁。
[0003]目前来说,在涉及危险化学品的实际工业过程中,由于各生产小组、各部门在业务过程中均会产生不同的数据,因而危险化学品在数据来源以及数据形式上均存在多样性,这使得对于危险化学品的监管方面难以做到数据侧的统筹兼顾与即时方便的获取,而数据信息的多样、分散不利于综合管理与信息获取。源自不同数据平台的数据会使得数据信息的获取变得复杂,降低数据获取效率,进而导致当用户有获取信息的需求时,很难通过一个简单的访问入口获取来自不同数据源的危险化学品的状态信息。
[0004]为了克服现有技术存在的上述缺陷,本领域亟需一种化学品知识图数据库的构建技术,能够融合不同来源、不同样式的危险化学品的信息数据,打破数据之间的壁垒,从而提供更加简洁有效的访问入口,高效获取危险化学品信息,以便更好地为用户提供信息服务与辅助决策。

技术实现思路

[0005]以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之前序。
[0006]为了克服现有技术存在的上述缺陷,本专利技术提供了一种化学品知识图数据库的构建方法、一种化学品知识图数据库的构建装置以及一种计算机可读存储介质,能够融合不同来源、不同样式的危险化学品的信息数据,打破数据之间的壁垒,从而提供更加简洁有效的访问入口,高效获取危险化学品信息,以便更好地为用户提供信息服务与辅助决策。
[0007]具体来说,根据本专利技术的第一方面提供的一种化学品知识图数据库的构建方法包括以下步骤:从数据源获取涉及化学品知识的多条字段信息;根据知识图谱中的本体定义和本体约束,获取各所述字段信息所对应的由语义三元组表示的映射配置记录;将各所述映射配置记录与所述数据源进行数据链接,以将各所述映射配置记录分别转化为连接所述数据源的数据三元组;以及基于连接所述数据源的数据三元组,构建所述化学品知识图数据库。
[0008]进一步地,在本专利技术的一些实施例中,所述本体定义包括本体的类别属性、关系属性和/或数据属性,所述本体约束包括所述类别属性、所述关系属性和/或所述数据属性之
间的相互约束关系,所述根据知识图谱中的本体定义和本体约束,获取各所述字段信息对应的由语义三元组表示的映射配置记录的步骤包括:根据所述本体的类别属性、关系属性和/或数据属性,确定所述字段信息所对应的至少一条映射规则;根据所述类别属性、关系属性和/或数据属性之间的相互约束关系,确定所述至少一条映射规则的唯一性;将满足唯一性的至少一条所述映射规则所对应的多条映射配置记录,组合成映射关系表。
[0009]进一步地,在本专利技术的一些实施例中,所述映射规则包括主



宾形式的语义三元组,所述根据所述本体的类别属性、关系属性和/或数据属性,确定所述字段信息所对应的至少一条映射规则的步骤包括:根据包括作为主语的所述类别属性的第一字段信息,确定其对应的第一映射规则为<第一字段名,rdf:type,类别属性>,在此,所述第一字段名具有普遍性,所述rdf:type为类型定义描述符,所述类别属性表示所述第一字段名所对应的类别属性;以及根据包括作为谓语的关系属性及其后连接宾语的第二字段信息,确定其对应的第二映射规则为<第二字段名,关系属性,第三字段名>,在此,所述第二字段名和所述第三字段名受制于所述第一映射规则的约束;此外,根据包括作为谓语的数据属性及其后连接宾语的第三字段信息,确定其对应的第三映射规则为<第四字段名,数据属性,第五字段名>,在此,所述第四字段名受制于所述第一映射规则的约束,所述第五字段名具有普遍性且包含数值信息。
[0010]进一步地,在本专利技术的一些实施例中,所述根据所述本体的类别属性、关系属性和/或数据属性,确定所述字段信息所对应的至少一条映射规则的步骤还包括:根据包括作为别名的字段名的第四字段信息,确定其对应的第四映射规则为<第六字段名,rdfs:label,第七字段名>,在此,所述第六字段名受制于所述第一映射规则的约束,所述rdfs:label为指定的别名标签,所述第七字段名为所述第六字段名所对应的别名名称。
[0011]进一步地,在本专利技术的一些实施例中,所述根据所述类别属性、关系属性和/或数据属性之间的相互约束关系,确定所述至少一条映射规则的唯一性的步骤包括:响应于任一所述字段信息被定义为第一类别、第一关系或第一数据属性,则不再将其定义为与所述第一类别、所述第一关系或所述第一数据属性类型处于同维度的第二类别、第二关系或第二数据属性。
[0012]进一步地,在本专利技术的一些实施例中,所述将各所述映射配置记录与所述数据源进行数据链接,以将各所述映射配置记录分别转化为连接所述数据源的数据三元组的步骤包括:获取所述数据源中的数据源表内容;将各所述映射配置记录分别连接对应的数据源表内容,以获得多条连接所述数据源的数据三元组;以及基于所述映射规则,对各所述各条映射配置记录进行分类,并将其对应的数据三元组分为类型定义三元组、关系属性三元组、数据属性三元组以及标签三元组。
[0013]进一步地,在本专利技术的一些实施例中,所述基于连接所述数据源的数据三元组,构建所述化学品知识图数据库的步骤包括:将所述数据三元组以数据流形式存储至图数据库,以构建所述化学品知识图数据库。
[0014]此外,根据本专利技术的第二方面提供的一种化学品知识图数据库的构建装置包括存储器及处理器。所述存储器上存储有计算机指令。所述处理器连接所述存储器,并被配置用于执行所述存储器上存储的计算机指令,以实施如本专利技术的第一方面中任一项所述的化学品知识图数据库的构建方法。
[0015]此外,根据本专利技术的第三方面提供的一种计算机可读存储介质,其上存储有计算机指令。所述计算机指令被处理器执行时,实施如本专利技术的第一方面中任一项所述的化学品知识图数据库的构建方法。
附图说明
[0016]在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本专利技术的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
[0017]图1示出了根据本专利技术的一些实施例所提供的一种化学品知识图数据库的构建方法的流程示意图;
[0018]图2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种化学品知识图数据库的构建方法,其特征在于,包括以下步骤:从数据源获取涉及化学品知识的多条字段信息;根据知识图谱中的本体定义和本体约束,获取各所述字段信息所对应的由语义三元组表示的映射配置记录;将各所述映射配置记录与所述数据源进行数据链接,以将各所述映射配置记录分别转化为连接所述数据源的数据三元组;以及基于连接所述数据源的数据三元组,构建所述化学品知识图数据库。2.如权利要求1所述的构建方法,其特征在于,所述本体定义包括本体的类别属性、关系属性和/或数据属性,所述本体约束包括所述类别属性、所述关系属性和/或所述数据属性之间的相互约束关系,所述根据知识图谱中的本体定义和本体约束,获取各所述字段信息对应的由语义三元组表示的映射配置记录的步骤包括:根据所述本体的类别属性、关系属性和/或数据属性,确定所述字段信息所对应的至少一条映射规则;根据所述类别属性、关系属性和/或数据属性之间的相互约束关系,确定所述至少一条映射规则的唯一性;将满足唯一性的至少一条所述映射规则所对应的多条映射配置记录,组合成映射关系表。3.如权利要求2所述的构建方法,其特征在于,所述映射规则包括主



宾形式的语义三元组,所述根据所述本体的类别属性、关系属性和/或数据属性,确定所述字段信息所对应的至少一条映射规则的步骤包括:根据包括作为主语的所述类别属性的第一字段信息,确定其对应的第一映射规则为<第一字段名,rdf:type,类别属性>,其中,所述第一字段名具有普遍性,所述rdf:type为类型定义描述符,所述类别属性表示所述第一字段名所对应的类别属性;以及根据包括作为谓语的关系属性及其后连接宾语的第二字段信息,确定其对应的第二映射规则为<第二字段名,关系属性,第三字段名>,其中,所述第二字段名和所述第三字段名受制于所述第一映射规则的约束;和/或根据包括作为谓语的数据属性及其后连接宾语的第三字段信息,确定其对应的第三映射规则为<第四字段名,数据属性,第五字段名>,其中,所述第四字...

【专利技术属性】
技术研发人员:钱锋王冰唐漾
申请(专利权)人:华东理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1