当前位置: 首页 > 专利查询>三峡大学专利>正文

抽水蓄能电站地下厂房施工过程多源信息的处理方法及系统技术方案

技术编号:39272684 阅读:10 留言:0更新日期:2023-11-07 10:51
本发明专利技术提出了一种抽水蓄能电站地下厂房施工过程多源信息的处理方法及系统,涉及数据处理技术领域,包括:采集抽水蓄能电站地下厂房施工过程中不同来源的原始数据并预处理;对原始数据进行知识抽取,得到第一知识图谱,对第一知识图谱进行知识挖掘,得到第二知识图谱;构建图神经网络框架,对第二知识图谱进行图谱融合,得到第三知识图谱;利用集成学习对第三知识图谱进行分析,得到数据分析结果;将原始数据、预处理后的原始数据、第一知识图谱、第二知识图谱、第三知识图谱和数据分析结果存储于数据库,并进行可视化展示。本发明专利技术能够对抽水蓄能电站地下厂房施工过程的多源信息快速有效的处理和分析,对地下厂房的数据管理起到了重要的作用。到了重要的作用。到了重要的作用。

【技术实现步骤摘要】
抽水蓄能电站地下厂房施工过程多源信息的处理方法及系统


[0001]本专利技术涉及信息处理
,尤其涉及一种抽水蓄能电站地下厂房施工过程多源信息的处理方法及系统。

技术介绍

[0002]抽水蓄能是目前技术最为成熟的大规模储能方式之一,是新型电力系统的重要组成部分,对实现“双碳”目标具有重要支撑作用。地下厂房是抽蓄电站能量转换的核心构筑物,是抽水蓄能电站工程的心脏和枢纽,也是整个抽蓄工程建设的关键。
[0003]国内常规水电工程已经在开展利用信息化系统进行施工过程中的质量、安全、进度、计量、结算等方面的精细化与动态管理的工作,并在实际工程中取得了较好的应用效果。但是在抽水蓄能电站工程中,很多土石坝施工已经建立了基于北斗高精度定位系统及BIM技术的施工过程多源信息综合展示、分析及动态优化调度与管理系统,而地下厂房施工过程中在这方面的利用还较少。
[0004]中国申请号为202010919979.8的专利技术专利公开了一种抽水蓄能电站综合管理方法、平台、系统、设备和介质,其利用BIMGIS模型,对抽水蓄能电站各电厂在施工前后各个阶段的数据进行渲染和三维显示,并对各个建构筑物、机组、设备等电厂对象进行全方位的了解与跟踪查询,同时通过BIMGIS模型来将各电厂对象与教培仿真课件、文档等相关联,打通各个子系统之间的信息孤岛,以三维可视化的方式实现数字化文档管理、教育培训、工程数字化交付、远程运维等工作。但该现有技术没有考虑到地下厂房的数据及特殊性,对于信息孤岛问题,也仅是以三维模拟的方式将各个类型的数据进行关联,并没有做到信息融合,达到真正的打通信息孤岛。

技术实现思路

[0005]有鉴于此,本专利技术提出了一种抽水蓄能电站地下厂房施工过程多源信息的处理方法及系统,利用知识图谱的优越性能,通过提出的有效图谱挖掘、图谱融合的方式来对多源信息进行处理和融合,并进行图谱可视化和快速查询,一定程度上解决了数据孤岛的问题,对于抽水蓄能电站地下厂房施工过程的多源信息能够快速有效的处理和分析,对地下厂房的数据管理起到了重要的作用。
[0006]本专利技术的技术方案是这样实现的,一方面,本专利技术提供了一种抽水蓄能电站地下厂房施工过程多源信息的处理方法
[0007]在以上技术方案的基础上,优选的,步骤S2包括:
[0008]S21采用D2R工具将结构数据按照映射规则进行映射,得到结构数据的三元组;
[0009]S22将非结构数据按照类型分为文档类和图像类,利用语义识别对文档类的非结构数据进行知识抽取,利用半监督学习算法对图像类的非结构数据进行知识抽取,得到非结构数据的三元组;
[0010]S23采用主动学习算法对半结构数据进行知识抽取,得到半结构数据的三元组;
[0011]其中,映射规则为:
[0012]表的行作为实例或资源;
[0013]当单元格所在的列为主键或外键,则其值被标注为实体;
[0014]当单元格所在的列是外键,则该列的列名被标注为同一行中主键与外键的关系;
[0015]当单元格所在的列不是外键,则该列的列名被标注为同一行中主键的属性,列值被标注为属性值。
[0016]在以上技术方案的基础上,优选的,步骤S22包括:
[0017]S221对文档类的非结构数据进行分词处理,得到每个词的词向量;
[0018]S222构建一个语义模型,语义模型包括双向神经网络、双向编码网络、多层双向编码网络、注意力网络、输出网络;
[0019]S223将词向量输入语义模型,利用双向神经网络提取词性特征,利用双向编码网络提取字符特征并对词向量进行编码,将字符特征与编码后的词向量进行拼接,得到初始词向量集合;
[0020]S224将初始词向量集合输入多层双向编码网络,提取隐藏特征,隐藏特征包含字符特征和语义特征,将隐藏特征和词性特征送入注意力网络,学习词性特征对隐藏特征的重要度,对词性特征进行加权后与初始词向量集合进行拼接,得到输出向量;
[0021]S225将输出向量送入输出网络,经过全连接层映射至预设维度,获取词向量对应标签的分布概率,将分布概率输入CRF层,对标签进行约束,得到标签分类结果,根据标签分类结果得到文档类的非结构数据的三元组;
[0022]S226针对图像类的非结构数据,采用预训练的半监督模型进行标注,标注的内容为实体、关系、属性或属性值,根据标注的结果得到图像类的非结构数据的三元组;
[0023]S227文档类的非结构数据的三元组和图像类的非结构数据的三元组组成非结构数据的三元组。
[0024]在以上技术方案的基础上,优选的,步骤S23包括:
[0025]S231对于半结构数据,专家对一部分的半结构数据进行人工标注,标注后作为已标记数据,半结构数据中除去已标记数据的剩余数据作为未标记数据;
[0026]S232将已标记数据输入分类模型中进行训练,调整分类模型的参数,根据F1分数评估模型精度,达到预期精度后得到预训练的分类模型;
[0027]S233利用预训练的分类模型对已标记数据和未标记数据进行多次分类预测,在预测过程中对分类模型进行微调,直至相邻两次的预测误差达到最小值,将最后一次分类的预测结果作为未标记数据的分类结果;
[0028]S234根据未标记数据的标注结果和已标记数据的分类结果得到半结构数据的三元组。
[0029]在以上技术方案的基础上,优选的,步骤S3包括:
[0030]S31构建深度嵌入网络模型并预训练;
[0031]S32将第一知识图谱输入深度嵌入网络模型进行实体预测和关系预测:
[0032]S321利用知识表示方法将第一知识图谱中的实体和关系进行向量化表示,得到实体向量和关系向量;
[0033]S322根据第一组合运算将实体向量通过第一投影函数投影到候选实体向量中,根
据第二组合运算将关系向量通过第二投影函数投影到候选关系向量中;
[0034]S323分别对候选实体向量和候选关系向量进行排序训练,根据第一损失函数和第二损失函数确定训练结束条件,训练结束即得到实体排序表和关系排序表;
[0035]S324将实体排序表的前M个实体作为实体预测结果,将关系排序表的前N个关系作为关系预测结果;
[0036]S33根据实体预测结果和关系预测结果对第一知识图谱进行补全,得到第二知识图谱;
[0037]其中,第一投影函数为:
[0038][0039]式中,h(e,r)是第一投影向量,f1和g1均为激活函数,W
1c
∈R
s
×
a
是候选实体向量,s为候选实体的数量,a代表维度,b1是投影偏置,表示第一组合运算;
[0040]第一组合运算为:
[0041][0042]式中,C
e
和C
r
为a*a的对角矩阵,b2∈R
a
表示运算偏置;
[0043]第一损失函本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种抽水蓄能电站地下厂房施工过程多源信息的处理方法,其特征在于,包括:S1采集抽水蓄能电站地下厂房施工过程中不同来源的原始数据,对原始数据进行预处理,将原始数据按照结构类型划分为结构数据、非结构数据和半结构数据;S2对结构数据、非结构数据和半结构数据分别进行知识抽取,得到结构数据、非结构数据和半结构数据对应的三元组,其中,知识抽取包括实体抽取、关系抽取和属性抽取,三元组格式为实体

关系

实体或实体

属性

属性值;S3将结构数据、非结构数据和半结构数据对应的三元组分别链接成图结构,得到三个第一知识图谱,分别为结构数据的知识图谱、非结构数据的知识图谱和半结构数据的知识图谱,对三个第一知识图谱进行知识挖掘,得到对应的三个第二知识图谱;S4构建图神经网络框架,包括图神经网络模型和图卷积网络模型,利用图神经网络模型对三个第二知识图谱分别进行图谱内的初步融合,采用图卷积网络模型对初步融合后的三个第二知识图谱进行图谱之间的两两融合,得到一个第三知识图谱;S5利用集成学习对第三知识图谱进行分析,得到数据分析结果;S6将原始数据、预处理后的原始数据、第一知识图谱、第二知识图谱、第三知识图谱和数据分析结果分层存储于数据库,并利用可视化工具对第三知识图谱和数据分析结果进行可视化展示。2.如权利要求1所述的方法,其特征在于,步骤S2包括:S21采用D2R工具将结构数据按照映射规则进行映射,得到结构数据的三元组;S22将非结构数据按照类型分为文档类和图像类,利用语义识别对文档类的非结构数据进行知识抽取,利用半监督学习算法对图像类的非结构数据进行知识抽取,得到非结构数据的三元组;S23采用主动学习算法对半结构数据进行知识抽取,得到半结构数据的三元组;其中,映射规则为:表的行作为实例或资源;当单元格所在的列为主键或外键,则其值被标注为实体;当单元格所在的列是外键,则该列的列名被标注为同一行中主键与外键的关系;当单元格所在的列不是外键,则该列的列名被标注为同一行中主键的属性,列值被标注为属性值。3.如权利要求2所述的方法,其特征在于,步骤S22包括:S221对文档类的非结构数据进行分词处理,得到每个词的词向量;S222构建一个语义模型,语义模型包括双向神经网络、双向编码网络、多层双向编码网络、注意力网络、输出网络;S223将词向量输入语义模型,利用双向神经网络提取词性特征,利用双向编码网络提取字符特征并对词向量进行编码,将字符特征与编码后的词向量进行拼接,得到初始词向量集合;S224将初始词向量集合输入多层双向编码网络,提取隐藏特征,隐藏特征包含字符特征和语义特征,将隐藏特征和词性特征送入注意力网络,学习词性特征对隐藏特征的重要度,对词性特征进行加权后与初始词向量集合进行拼接,得到输出向量;S225将输出向量送入输出网络,经过全连接层映射至预设维度,获取词向量对应标签
的分布概率,将分布概率输入CRF层,对标签进行约束,得到标签分类结果,根据标签分类结果得到文档类的非结构数据的三元组;S226针对图像类的非结构数据,采用预训练的半监督模型进行标注,标注的内容为实体、关系、属性或属性值,根据标注的结果得到图像类的非结构数据的三元组;S227文档类的非结构数据的三元组和图像类的非结构数据的三元组组成非结构数据的三元组。4.如权利要求2所述的方法,其特征在于,步骤S23包括:S231对于半结构数据,专家对一部分的半结构数据进行人工标注,标注后作为已标记数据,半结构数据中除去已标记数据的剩余数据作为未标记数据;S232将已标记数据输入分类模型中进行训练,调整分类模型的参数,根据F1分数评估模型精度,达到预期精度后得到预训练的分类模型;S233利用预训练的分类模型对已标记数据和未标记数据进行多次分类预测,在预测过程中对分类模型进行微调,直至相邻两次的预测误差达到最小值,将最后一次分类的预测结果作为未标记数据的分类结果;S234根据未标记数据的标注结果和已标记数据的分类结果得到半结构数据的三元组。5.如权利要求1所述的方法,其特征在于,步骤S3包括:S31构建深度嵌入网络模型并预训练;S32将第一知识图谱输入深度嵌入网络模型进行实体预测和关系预测:S321利用知识表示方法将第一知识图谱中的实体和关系进行向量化表示,得到实体向量和关系向量;S322根据第一组合运算将实体向量通过第一投影函数投影到候选实体向量中,根据第二组合运算将关系向量通过第二投影函数投影到候选关系向量中;S323分别对候选实体向量和候选关系向量进行排序训练,根据第一损失函数和第二损失函数确定训练结束条件,训练结束即得到实体排序表和关系排序表;S324将实体排序表的前M个实体作为实体预测结果,将关系排序表的前N个关系作为关系预测结果;S33根据实体预测结果和关系预测结果对第一知识图谱进行补全,得到第二知识图谱;其中,第一投影函数为:式中,h(e,r)是第一投影向量,f1和g1均为激活函数,W
1c
∈R
s
×...

【专利技术属性】
技术研发人员:严立阳
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1