一种三角图与知识图谱的融合方法技术

技术编号:31374592 阅读:15 留言:0更新日期:2021-12-15 11:07
本发明专利技术公开了一种三角图与知识图谱的融合方法,属于知识图谱的技术领域。其包括步骤1:利用马尔可夫图方法将含有三角图的沉积学PDFA文件转换为灰度图像;步骤2:重构砂岩三角图,根据三角图获取底边数据,计算每个三角图图形边缘值;步骤3:分析沉积学中各砂岩实体与砂岩实体间关系,去除同义砂岩实体名,构建沉积学领域砂岩知识图谱;步骤4:对砂岩内部成分划界,计算各砂岩实体之间临界值,明确砂岩内各组成成分的含量范围值;步骤5:构建三角图与知识图谱的链接关系,形成砂岩图谱三角图,实现每次点击三角图内任一点时,获取到对应三角图各属性值,并产生对应砂岩实体知识图谱,提供了适用于砂岩三角图分析数值工作的方法。供了适用于砂岩三角图分析数值工作的方法。供了适用于砂岩三角图分析数值工作的方法。

【技术实现步骤摘要】
一种三角图与知识图谱的融合方法


[0001]本专利技术涉及知识图谱的
,特别涉及一种三角图与知识图谱的融合方法。

技术介绍

[0002]知识图谱是一门把语言学、计算机科学、数学等相关领域融为一体的交叉学科,知识图谱逐渐渗透到各行各业用于文本数据挖掘和信息存储。当前,大量的企业和组织将与日俱增的数据信息完全或者部分通过知识图谱,推理出有价值的核心热点,以降低检索时间并提高分析信息能力。
[0003]沉积学领域中对文本中三角图数据分析量的不断增加,特别是在大数据时代,三角图数据分析需要学习掌握多种分类类别和繁杂的命名种类,大大加大了探索研究的难度。为了应对与日俱增的分析需求,沉积学领域需要领域专家需要学习分析相关对照手册。当前沉积学领域普遍依赖人工查询定点,人工查询定点会消耗大量时间,影响数据时效性,制约了信息化产业的动态发展。
[0004]随着三角图在沉积学砂岩领域的广泛应用,文本三角图产生热点的数据日益增长,将会对三角图内数据分析带来挑战。为了应对沉积学领域节约时间开销的迫切需求,在知识图谱处理支撑三角图数据中,如何实现面向沉积学文本三角图定位分析是工业界和学术界关注的热点。

技术实现思路

[0005]本专利技术针对沉积学砂岩领域文本中三角图对应砂岩种类和本体关系无法直接产生关联这个空缺,提供沉积学砂岩领域文献中三角图与知识图谱的融合方法,适用于砂岩三角图分析数值工作。
[0006]为实现上述目的,本专利技术采用以下技术方案:本专利技术一种三角图与知识图谱的融合方法,步骤1:利用马尔可夫图方法将含有三角图的沉积学PDFA文件转换为灰度图像;步骤2:重构砂岩三角图,根据三角图获取底边数据,计算每个三角图图形边缘值;步骤3:分析沉积学中各砂岩实体与砂岩实体间关系,去除同义砂岩实体名,构建沉积学领域砂岩知识图谱;步骤4:对砂岩内部成分划界,计算各砂岩实体之间临界值,明确砂岩内各组成成分的含量范围值;步骤5:构建三角图与知识图谱的链接关系,形成砂岩图谱三角图,实现每次点击三角图内任一点时,获取到对应三角图各属性值,并产生对应砂岩实体知识图谱。
[0007]进一步地,步骤一中,所述马尔可夫图方法将含有三角图的沉积学PDFA文件的每一页全部转化为图片格式的文档,其马尔可夫链的状态转移矩阵P表示为{P
i,j
|0≤i≤255,0≤j≤255},其中P
i,j
是PDFA字节流中字节值i到字节值j的转换概率,计算方法如式所示:
式中,W
i,j
是PDFA字节流中从字节值i到字节值j的转换次数,为了显示为灰度位图图像,状态转换矩阵P被缩放为I:I=255/max(p)P;式中,所有PDFA文件的马尔可夫图的图像大小相同,图像的像素为256
×
256,max(p)表示为PDFA字节流中字节值i到字节值j的转换的最大概率。
[0008]进一步地,步骤2中,所述重构砂岩三角图的具体内容为:在PDFA文件中,三角图成等边三角形呈现,其会出现在文件随机的位置,在计算机中,将PDFA文件的横坐标定义为X,纵坐标定义为Y,其X=0表示文件最左边,Y=0表示文件最上边,将三角图左下角点标定义为(x0,y0),其中x0代表三角图左下角点横坐标,y0代表三角图左下角点纵坐标,(x2,y2)代表三角图右下角点坐标,其中x2代表三角图右下角点横坐标,y2代表三角图右下角点纵坐标,计算三角图顶点坐标(x1,y1)为:x1=(x2‑
x0)/2;式中x2‑
x0代表三角图底边长度。
[0009]进一步地,步骤3中,所述知识图谱包括本体词典列表和实体关系词典列表,整合沉积学砂岩领域所有教科书文本,获取教课书中所有砂岩实体、属性、框架的本体词典列表,同时整合各砂岩实体、属性和框架之间的关系,并获得实体关系词典列表;所述本体词典列表数据集SST={sst1,sst2,...,sst
N
},其中,sst1表示第一个种类的本体词典列表,sst2表示第二个种类的本体词典列表,sst
N
表示第N个种类的本体词典列表,同时遍历所有本体名去除相同本体名,确保本体的唯一性;SSTR={sstr
1,2
,,sstr
1,3
,...,sstr
M,N
},其中sstr
1,2
表示sst1和sst2存在本体关系,sstr
1,3
表示sst1和sst3存在本体关系,sstr
M,N
表示sst
M
和sst
N
存在本体关系;所述实体关系词典列表的种类记录的是一个多属性元组,SSTR中种类表示为sr=(Garzanti,Dott,Gilbert,Pettijohn,Crook,Dapples,Folk,Mcbride,Van_Andel,Wackes,Arenite,Firstproperties,Secondproperties,Thirdproperties,Forthproperties,Dataproperty),其中Garzanti代表本体关系中Garzanti对砂岩种类分类的定义,Dott代表本体关系中Dott对砂岩种类分类的定义,Gilbert代表本体关系中Gilbert对砂岩种类分类的定义,Pettijohn代表本体关系中Pettijohn对砂岩种类分类的定义,Crook代表本体关系中Crook对砂岩种类分类的定义,Dapples代表本体关系中Dapples对砂岩种类分类的定义,Folk代表本体关系中Folk对砂岩种类分类的定义,Mcbride代表本体关系中Mcbride对砂岩种类分类的定义,Van_Andel代表本体关系中Van_Andel对砂岩种类分类的定义,Wackes代表本体关系中对砂岩种类下含量的分类定义,Arenite代表本体关系中对砂岩种类下含量的分类定义,Firstproperties,Secondproperties,Thirdproperties,Forthproperties代表本体关系中对层级属性的定义,Dataproperty代表本体关系中对各部分数量属性定义。
[0010]进一步地,步骤5中,所述构建三角图与知识图谱的链接关系具体步骤如下:步骤5.1:将三角图的等边三角形的每条边都定义为0%到100%的刻度尺,将三角
图左下角点到右下角点定义为长石F的含量,其范围为0%到100%,将顶点到左下角点定义为石英Q的含量,其范围为0%到100%,将顶点到右下角点定义为岩屑L的含量,其范围为0%到100%;步骤5.2:计算三角形内任意一点所占比重P,及所对应数值V;设顶点为P1,左下角点为P0,右下角为P2,对应数值为V1,V0,V2,算出石英边值V
′1:V
′1=(1

T2)*V0+T2*V1;岩屑边值V
′2:V
′2=(1

T1)*V2+T1*V0长石边值V
′3:V<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种三角图与知识图谱的融合方法,其特征在于:步骤1:利用马尔可夫图方法将含有三角图的沉积学PDFA文件转换为灰度图像;步骤2:重构砂岩三角图,根据三角图获取底边数据,计算每个三角图图形边缘值;步骤3:分析沉积学中各砂岩实体与砂岩实体间关系,去除同义砂岩实体名,构建沉积学领域砂岩知识图谱;步骤4:对砂岩内部成分划界,计算各砂岩实体之间临界值,明确砂岩内各组成成分的含量范围值;步骤5:构建三角图与知识图谱的链接关系,形成砂岩图谱三角图,实现每次点击三角图内任一点时,获取到对应三角图各属性值,并产生对应砂岩实体知识图谱。2.根据权利要求1所述的融合方法,其特征在于:步骤一中,所述马尔可夫图方法将含有三角图的沉积学PDFA文件的每一页全部转化为图片格式的文档,其马尔可夫链的状态转移矩阵P表示为{P
i,j
|0≤i≤255,0≤j≤255},其中P
i,j
是PDFA字节流中字节值i到字节值j的转换概率,计算方法如式所示:式中,W
i,j
是PDFA字节流中从字节值i到字节值j的转换次数,为了显示为灰度位图图像,状态转换矩阵P被缩放为I:I=255/max(p)P;式中,所有PDFA文件的马尔可夫图的图像大小相同,图像的像素为256
×
256,max(p)表示为PDFA字节流中字节值i到字节值j的转换的最大概率。3.根据权利要求2所述的融合方法,其特征在于,步骤2中,所述重构砂岩三角图的具体内容为:在PDFA文件中,三角图成等边三角形呈现,其会出现在文件随机的位置,在计算机中,将PDFA文件的横坐标定义为X,纵坐标定义为Y,其X=0表示文件最左边,Y=0表示文件最上边,将三角图左下角点标定义为(x0,y0),其中x0代表三角图左下角点横坐标,y0代表三角图左下角点纵坐标,(x2,y2)代表三角图右下角点坐标,其中x2代表三角图右下角点横坐标,y2代表三角图右下角点纵坐标,计算三角图顶点坐标(x1,y1)为:x1=(x2‑
x0)/2;式中x2‑
x0代表三角图底边长度。4.根据权利要求3所述的融合方法,其特征在于:步骤3中,所述知识图谱包括本体词典列表和实体关系词典列表,整合沉积学砂岩领域所有教科书文本,获取教课书中所有砂岩实体、属性、框架的本体词典列表,同时整合各砂岩实体、属性和框架之间的关系,并获得实体关系词典列表;所述本体词典列表数据集SST={sst1,sst2,...,sst
N
},其中,sst1表示第一个种类的本体词典列表,sst2表示第二个种类的本体词典列表,sst
N
表示第N个种类的本体词典列表,同时遍历所有本体名去除相同本体名,确保本体的唯一性;SSTR={sstr
1,2
,,sstr
1,3
,...,sstr
M,N
},其中sstr
1,2
表示sst1和sst2存在本体关系,sstr
1,3
表示sst1和sst3存在本体关系,sstr
M,N
表示sst
M
和sst
N
存在本体关
系;所述实体关系词典列表的种类记录的是一个多属性元组,SSTR中种类表示为sr=(Garzanti,Dott,Gilbert,Pettijohn,Crook,Dapples,Folk,Mcbride,Van_Andel,Wackes,Arenite,Firstproperties,Secondproperties,Thirdproperties,Forthproperties,Dataproperty),其中Garzanti代表本体关系中Garzanti对砂岩种类分类的定义,Dott代表本体关系中Dott对砂岩种类分类的定义,Gilbert代表本体关系中Gilbert对砂岩种类分类的定义,Pettijohn代表本体关系中Pettijohn对砂岩种类分类的定义,Crook代表本体关系中Crook对砂岩种类分类的定义,Dapples代表本体关系中Dapples对砂岩...

【专利技术属性】
技术研发人员:胡志臣许小龙胡祥奔唐柏轩
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1