一种面向地质灾害领域的知识图谱自动化构建方法及系统技术方案

技术编号:34013068 阅读:12 留言:0更新日期:2022-07-02 15:04
本发明专利技术公开一种面向地质灾害领域的知识图谱自动化构建方法及系统,方法包括以下步骤:采用自上而下的方法构建地质灾害链本体模型;采用五元组方法对所述本体模型进行逻辑结构描述;根据先验知识对本体模型进行语义关系表达;采用自下而上的方法,根据建立的本体模型,利用知识抽取技术从中已有地质灾害报告中抽取地质灾害实体、属性及其关系;对抽取的地质灾害实体、属性及其关系,进行要素分解,建立具体要素与本体模型的映射关系,最终通过对齐、融合方式自动生成知识图谱。本发明专利技术有益效果是:有效解决了单一灾体的建模无法准确描述地质灾害所存在的局限性等问题。地质灾害所存在的局限性等问题。地质灾害所存在的局限性等问题。

【技术实现步骤摘要】
一种面向地质灾害领域的知识图谱自动化构建方法及系统


[0001]本专利技术涉及地震预测领域,尤其涉及一种面向地质灾害领域的知识图谱自动化构建方法及系统。

技术介绍

[0002]知识图谱概念起源于2012年5月,最初由谷歌公司提出,旨在揭示知识领域的动态发展规律。在知识图谱中,实体、关系和属性是组成要素,通常用节点表示语义符号,用边表示语义之间的关系。随着信息向知识的转变,知识图谱与地学知识的结合融合了语义关系和空间信息的特点,从而具备人、地、空多层次知识的大规模关联和因果分析的能力。
[0003]在地学领域中,周成虎等人提出从现有大量的地学文献中提取地学知识,实现地学知识图谱的构建,扩展地学知识所特有的时空特征,融合多源地学要素,建立地学知识表达模型。而在灾害知识图谱构建方面,一般以本体为基础理论用于灾害知识建模,形成灾害知识的可视化表达。在灾害知识图谱构建方面,目前已有多位学者做了相关研究,一般以本体为基础理论用于灾害知识建模,形成灾害知识的可视化表达,但由于地质灾害数据具有多源异构的特质,因而从自然语言表达的角度构建地质灾害链知识图谱,将灾害发生的环境、灾害本体、地理对象以及应急处理实现多层次知识的关联,达到不同来源数据的集成、融合和存储的目的。目前大多数研究是通过构建不同来源的本体知识对灾害事件单一要素进行描述,分析灾害事件的演化过程与关联的关系,但不能全面分析由原生灾害引起的次生灾害的过程,难以整体及准确地描述地质灾害发生机理。

技术实现思路

[0004]为了解决以上问题,本申请提供的一种面向地质灾害领域的知识图谱自动化构建方法,具体包括以下步骤:
[0005]S101:采用自上而下的方法构建地质灾害链本体模型;采用五元组方法对所述本体模型进行逻辑结构描述;根据先验知识对本体模型进行语义关系表达;
[0006]S102:采用自下而上的方法,根据建立的本体模型,利用知识抽取技术从中已有地质灾害报告中抽取地质灾害实体、属性及其关系;
[0007]S103:对抽取的地质灾害实体、属性及其关系,进行要素分解,建立具体要素与本体模型的映射关系,最终通过对齐、融合方式自动生成知识图谱。
[0008]进一步地,所述本体模型包括:地质环境本体、地质灾害本体、地理对象本体和应急处置本体。
[0009]进一步地,对本体模型进行逻辑结构描述,具体为:
[0010]Onto=(Con,Rel,Prop,Rule,Ins)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0011]其中,Con指概念,代表一系列具有相同特性的事物的集合总称;Rel指关系,代表概念之间、概念与实例之间的层次关系,以及实例之间的时空关系及语义关系;Prop指属性,代表实例对象间的关联性以及实例与数值间的关联性;Rule指规则,代表对领域概念及
实例的取值范围、类型及组合方式的约束表达。
[0012]进一步地,根据先验知识对本体模型进行语义关系表达,具体为:
[0013]地质环境本体为地质灾害本体的孕灾环境;
[0014]应急处置本体为地质灾害本体的响应及应对措施;
[0015]地理对象本体为地质灾害本体的承灾体;
[0016]地理对象本体又为应急处置本体的处理对象。
[0017]一种面向地质灾害领域的知识图谱自动化构建系统,所述系统包括:
[0018]地质灾害链本体模型构建模块:采用自上而下的方法构建地质灾害链本体模型;采用五元组方法对所述本体模型进行逻辑结构描述;根据先验知识对本体模型进行语义关系表达;
[0019]知识抽取模块:采用自下而上的方法,根据建立的本体模型,利用知识抽取技术从中已有地质灾害报告中抽取地质灾害实体、属性及其关系;
[0020]知识图谱生成模块:对抽取的地质灾害实体、属性及其关系,进行要素分解,建立具体要素与本体模型的映射关系,最终通过对齐、融合方式自动生成知识图谱。
[0021]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述一种面向地质灾害领域的知识图谱自动化构建方法的步骤。
[0022]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述一种面向地质灾害领域的知识图谱自动化构建方法的步骤。
[0023]与现有技术相比,本专利技术的有益效果包括:
[0024]1、本专利技术以知识图谱理论与方法为指导,构建了地质灾害链统一逻辑表达框架,对地质灾害领域中的地质灾害事件、地质环境本体、地理对象本体及应急处置本体四类核心要素进行了定义与构建,对其中的概念间、实例间属性及语义关系进行了本体层上的分类及定义。
[0025]2、本专利技术有效解决了单一灾体的建模无法准确描述地质灾害所存在的局限性等问题。
[0026]3、能清晰及准确表达地质灾害实体间、实体与属性间丰富的语义关系,有效验证了本专利技术所提出的地质灾害知识图谱构建方法的可行性与有效性,为地学知识图谱的构建与研究提供了一种思路。
附图说明
[0027]图1是本专利技术方法的流程图;
[0028]图2是地质灾害知识图谱构建示意图;
[0029]图3是地质灾害链本体实例构建示意图(部分);
[0030]图4是基于时空演化的地质灾害知识图谱示意图(部分);
[0031]图5是面向过程的地质灾害链知识图谱示意图(部分)。
具体实施方式
[0032]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0033]本专利技术提供了一种面向地质灾害领域的知识图谱自动化构建方法。请参考图1,图1是本专利技术方法的流程图;本专利技术方法包括以下步骤:
[0034]S101:采用自上而下的方法构建地质灾害链本体模型;采用五元组方法对所述本体模型进行逻辑结构描述;根据先验知识对本体模型进行语义关系表达;
[0035]需要说明的是,对地质灾害链本体的建模,是以地质灾害事件为核心,通过本体实现地质灾害概念及实例的形式化与逻辑化表达,用以支持地学知识发现与知识推理。
[0036]地质灾害事件其基本要素包括时间、空间和现象等,具有典型的时空特征,其信息的抽取与知识表达需要考虑时空问题。
[0037]本申请中,地质灾害链本体模型包含地质环境本体、地质灾害本体、地理对象本体和应急处置本体四个部分。请参考图2所示,图2是知识图谱构建的具体可视化流程示意图。
[0038]为了在统一的语义表达框架下,将地质领域知识进行归纳及整理,从而构建知识体系之间的逻辑关联,最终服务于信息抽取及知识推理,本专利技术对地质灾害链本体进行了逻辑结构表达;
[0039]具体的说,由于五元组表示方法可满足对地质灾害及其作用下的地质环境、地质对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向地质灾害领域的知识图谱自动化构建方法,其特征在于:包括以下步骤:S101:采用自上而下的方法构建地质灾害链本体模型;采用五元组方法对所述本体模型进行逻辑结构描述;根据先验知识对本体模型进行语义关系表达;S102:采用自下而上的方法,根据建立的本体模型,利用知识抽取技术从中已有地质灾害报告中抽取地质灾害实体、属性及其关系;S103:对抽取的地质灾害实体、属性及其关系,进行要素分解,建立具体要素与本体模型的映射关系,最终通过对齐、融合方式自动生成知识图谱。2.如权利要求1所述的一种面向地质灾害领域的知识图谱自动化构建方法,其特征在于:所述本体模型包括:地质环境本体、地质灾害本体、地理对象本体和应急处置本体。3.如权利要求1所述的一种面向地质灾害领域的知识图谱自动化构建方法,其特征在于:对本体模型进行逻辑结构描述,具体为:Onto=(Con,Rel,Prop,Rule,Ins)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,Con指概念,代表一系列具有相同特性的事物的集合总称;Rel指关系,代表概念之间、概念与实例之间的层次关系,以及实例之间的时空关系及语义关系;Prop指属性,代表实例对象间的关联性以及实例与数值间的关联性;Rule指规则,代表对领域概念及实例的取值范围、类型及组合方式的约束表达。4.如权利要求2所述的一种面向地质灾害...

【专利技术属性】
技术研发人员:邱芹军马凯谢忠陶留锋盛冠群
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1