一种基于知识图谱的供电运维全要素数据融合方法技术

技术编号:36388589 阅读:61 留言:0更新日期:2023-01-18 09:52
一种基于知识图谱的供电运维全要素数据融合方法,包括如下步骤:获取历史故障文档抽取得到故障的要素信息,按照各个故障的位置和故障持续的时间大小进行排序,进行故障建模得到故障模型,使用TF

【技术实现步骤摘要】
一种基于知识图谱的供电运维全要素数据融合方法


[0001]本专利技术涉及信息处理
,具体涉及轨道交通
,尤其涉及一种基于知识图谱的供电运维全要素数据融合方法。

技术介绍

[0002]轨道交通的安全运行离不开安全、规范、可靠的供电系统,供电系统是轨道交通运输的血液,是核心系统,供电系统一旦产生故障或中断,不仅会造成城市轨道交通运输的瘫痪,而且还会危及乘客生命安全,并对地线公共交通运输带来巨大压力,对社会稳定和城市形象造成不良影响。
[0003]知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
[0004]现有技术中,公开号为CN112307218A的专利技术专利公开了一种基于知识图谱的智能电厂典型设备故障诊断知识库构建方法,该方法直接面向智能电厂典型设备故障诊断领域,将源于工厂和互联网的多模态故障诊断数据与专家知识结合设计构建了故障诊断知识图谱,存储在知识库中,有效提升了故障诊断的自动化水平。重新设计了“双层——三要素”形式的塔形知识图谱架构,表意能力强的同时便于检索应用。本专利技术通过使用双向GRU模型无监督构建了知识图谱中文本的描述向量,包含文本的语义信息,可用于优化故障诊断知识图谱,提升推理计算效率,对于故障诊断知识图谱落地应用具有重要意义。公开号为CN114491037A的专利技术专利公开了一种基于知识图谱的故障诊断方法、装置、设备及介质。其中方法包括:在设备故障时,基于设备故障知识图谱确定当前故障设备的特征向量,所述设备故障知识图谱基于历史故障设备的故障诊断数据构建的;确定所述当前故障设备的特征向量与所述设备故障知识图谱中每个历史故障设备的特征向量之间的相似度;将最高相似度对应历史故障设备的诊断结果,确定为所述当前故障设备的诊断结果,并推送所述诊断结果对应的解决方案给所述当前故障设备。本申请能够提高设备故障诊断的准确性,改善设备故障诊断效果。基于此类的现有技术还有,其具体的实现方式都是基于建模,TF

IDF编码和匹配等方式实现,对于数据存储的容量和速度,以及故障出现的连续性并没有针对性的设计。
[0005]地铁供电运维业务涉及台账维护、运行监视、维修作业、预防性试验、巡视作业、安全、应急等一系列业务,保障设备安全稳定运行,同时产生大量历史数据痕迹,但由于数据分散、格式多样,难以对历史痕迹数据进行分析利用,无法为设备稳定运行产生新价值。

技术实现思路

[0006]本专利技术的目的在于克服现有技术的不足,提供一种基于知识图谱的供电运维全要素数据融合方法,该方法结合知识图谱技术,采用知识图谱结合各种业务数据进行分析和提炼,对各类设备和节点提供故障研判和故障匹配的功能,对历史经验数据进行汇聚、解
析、融合,解决历史经验数据难以有效利用的问题。
[0007]本专利技术提供了一种基于知识图谱的供电运维全要素数据融合方法,包括如下步骤:
[0008](1)获取历史故障文档作为源数据,将其按照各个故障的位置先进行分类排序,然后在同一位置故障排序的基础上,将同一位置的源数据按照故障持续的时间大小进行排序;利用故障知识按照分类和排序的顺序抽取所述历史故障文档得到故障的要素信息;估算故障要素信息对应转化为字符串的数量;
[0009](2)将故障要素信息按照故障模型的方式进行组织,进行故障建模得到故障模型;
[0010](3)将故障模型中的各个要素拼接成完整字符串,使用TF

IDF编码实现故障信息的向量化,得到故障描述的向量表示;针对故障描述的向量表示进行字符串中包含字符数量的计算,并随机选取字符串的一位字符和其字符在字符串中的位置,再将字符在字符串中的位置转换为在对应要素信息中的位置;
[0011](4)将步骤(1)中估算的字符串的数量和计算得到的字符串中包含字符数量进行对比,如果相同则按照步骤(3)中转换得到的字符在对应要素信息中的位置,在步骤(1)中对应的故障的要素信息中进行查找后比对,如果相同,则进入下一步骤;
[0012](5)将经过向量化转换好故障描述的向量和故障知识库中的向量进行相似度匹配,计算故障之间的匹配程度,返回知识库中相似度最高的故障记录;
[0013](6)识别出故障类型,针对不同类型的节点推送不同的信息集。
[0014]其中,所述步骤(1)中具体还包括:
[0015](1.1)对历史故障文档按照树型结构进行层层划分,每个事件信息用有向图表示,每个叶子节点的事件中保存故障相关的详细信息,其包括一个故障事件从发生到解决的完整过程;
[0016](1.2)对经过处理后的历史故障文档,进行实体和关系的故障知识抽取。
[0017]其中,所述步骤(1.1)中将每个故障事件拆分成事件信息、故障信息和处置信息三个部分,其中:
[0018]事件信息,存储故障事件中出现的设备和故障事件中的原始文本信息;其中,原始文本信息包括该故障事件的概述、影响以及原因分析中的至少一个;
[0019]故障信息,包含故障发生的特征和故障名称;
[0020]处置信息,根据历史故障文档中给出的解决方案,识别关键的动作和实体,并且把动作作为关系,把历史故障文档中宾语作为关系所指向的实体。
[0021]其中,所述步骤(1)中利用故障知识抽取所述历史故障文档得到故障的要素信息具体为经过故障知识抽取部分的TPLinker模型后得到故障的要素信息。
[0022]其中,所述为经过故障知识抽取部分的TPLinker模型后得到故障的要素信息具体为:
[0023]给定两个实体p1和p2,以及一条特定的关系类型r,模型尝试回答以下三个问题:
[0024]a)p1和p2是不是两个相同实体的开始和结束位置;
[0025]b)p1和p2是不是关系r中涉及到的两个实体的开始位置;
[0026]c)p1和p2是不是关系r中涉及到的两个实体的结束位置;
[0027]TPLinker模型使用握手标记方法来回答这三个问题,并且为每个关系标注三个矩
阵来表示不同的标记结果。
[0028]其中,所述故障要素包括所在变电所、故障设备、故障描述、故障时中的至少一种。
[0029]其中,所述步骤(3)中使用TF

IDF编码实现故障信息的向量化,得到故障描述的向量表示,具体为:
[0030]TF

IDF的值最终由TF和IDF的乘积来决定,TF

IDF编码的计算方式如下;
[0031]TF的计算过程为:
[0032][0033]IDF的计算过程为:
[0034][0035]平滑操作过程为:
[0036]sim
TF

IDF
=tf
ij
*id本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的供电运维全要素数据融合方法,其特征在于,包括如下步骤:(1)获取历史故障文档作为源数据,将其按照各个故障的位置先进行分类排序,然后在同一位置故障排序的基础上,将同一位置的源数据按照故障持续的时间大小进行排序;利用故障知识按照分类和排序的顺序抽取所述历史故障文档得到故障的要素信息;估算故障要素信息对应转化为字符串的数量;(2)将故障要素信息按照故障模型的方式进行组织,进行故障建模得到故障模型;(3)将故障模型中的各个要素拼接成完整字符串,使用TF

IDF编码实现故障信息的向量化,得到故障描述的向量表示;针对故障描述的向量表示进行字符串中包含字符数量的计算,并随机选取字符串的一位字符和其字符在字符串中的位置,再将字符在字符串中的位置转换为在对应要素信息中的位置;(4)将步骤(1)中估算的字符串的数量和计算得到的字符串中包含字符数量进行对比,如果相同则按照步骤(3)中转换得到的字符在对应要素信息中的位置,在步骤(1)中对应的故障的要素信息中进行查找后比对,如果相同,则进入下一步骤;(5)将经过向量化转换好故障描述的向量和故障知识库中的向量进行相似度匹配,计算故障之间的匹配程度,返回知识库中相似度最高的故障记录;(6)识别出故障类型,针对不同类型的节点推送不同的信息集。2.如权利要求1所述的方法,其特征在于:所述步骤(1)具体为:(1.1)对历史故障文档按照树型结构进行层层划分,每个事件信息用有向图表示,每个叶子节点的事件中保存故障相关的详细信息,其包括一个故障事件从发生到解决的完整过程;(1.2)对经过处理后的历史故障文档,进行实体和关系的故障知识抽取。3.如权利要求2所述的方法,其特征在于:所述步骤(1.1)中将每个故障事件拆分成事件信息、故障信息和处置信息三个部分,其中:事件信息,存储故障事件中出现的设备和故障事件中的原始文本信息;其中,原始文本信息包括该故障事件的概述、影响以及原因分析中的至少一个;故障信息,包含故障发生的特征和故障名称;处置...

【专利技术属性】
技术研发人员:邢春阳李国玉魏荣耀张岩安佰秀
申请(专利权)人:青岛城市轨道交通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1