一种识别新能源异常数据的知识图谱构建方法和系统技术方案

技术编号:37985168 阅读:16 留言:0更新日期:2023-06-30 09:59
本发明专利技术提出一种识别新能源异常数据的知识图谱构建方法和系统。其中,方法包括:利用知识图谱对异常数据信息及与其相关的关系进行表示,突破传统方法难以适应复杂的新能源数据异常情况的局限,在充分梳理异常数据内在逻辑的基础上,提取构建异常数据知识图谱所需的信息,从而实现知识图谱的构建,并提出异常数据自动追踪的方法,实现基于知识图谱的“出现异常数据——进行异常定位——进行异常判定——进行异常溯源”的全过程管理。的全过程管理。的全过程管理。

【技术实现步骤摘要】
一种识别新能源异常数据的知识图谱构建方法和系统


[0001]本专利技术属于新能源和知识图谱数据预处理领域,尤其涉及一种识别新能源异常数据的知识图谱构建方法和系统。

技术介绍

[0002]在新能源场站现场采集的生产数据,不仅可以直接反映生产设备的运行状况,而且是进行数据分析、故障诊断、功率预测及生产管理等工作的基础。但是,在新能源场站生产过程中,由于存在地理环境复杂、天气情况多变、生产状况众多等原因,例如通信异常、极端天气、设备故障与人为因素等等,导致采集上来的很多能源场站的生产数据质量较差,直接利用这些异常数据会对场站的真实生产情况产生严重的偏差,无法准确且有效反映新能源场站设备的真实运行情况,对新能源场站的运行管理与调度产生不利影响;此外,由于无法及时对异常数据进行判别并回溯故障原因,导致异常数据与产生原因之间的真实规律难以被发现,从而无法找到解决异常数据的有效办法,尝尝导致事倍功半。

技术实现思路

[0003]为解决上述技术问题,本专利技术提出一种识别新能源异常数据的知识图谱构建方法的技术方案,以解决上述技术问题。
[0004]本专利技术第一方面公开了一种识别新能源异常数据的知识图谱构建方法,所述方法包括:
[0005]步骤S1、由物件域知识图谱和异常事件域知识图谱组成新能源异常数据知识图谱的总体架构,即G=(E,R,S,U);所述物件域知识图谱由三元组构成,即G=(E,R,S);U为异常事件域知识图谱,代表异常数据的类型及情况;
[0006]步骤S2、根据新能源的电站、设备、测点位置和地理位置,自顶向下构建所述物件域知识图谱;
[0007]步骤S3、根据时序数据曲线、日志文件和气象数据,由底向上构建异常事件域知识图谱;
[0008]步骤S4、将所述物件域知识图谱与异常事件域知识图谱进行关联,得到新能源异常数据总体知识图谱G=(E,R,S,U)。
[0009]根据本专利技术第一方面的方法,在所述步骤S2中,所述物件域知识图谱由若干个三元组组成,表示“实体—关系—实体”、“实体—关系—属性”或者“概念—属性—属性值”;
[0010]所述实体包括:电站和设备;
[0011]所述概念包括:地域、电站类型、设备类型、季节、月份和天气类型;
[0012]所述属性包括:电站的容量、经纬度、并网时间、并网电压等级和所属企业,设备的厂家和型号及天气类型中的雨量大小;
[0013]所述属性值指物件域实体对象或者概念相关属性的值。
[0014]根据本专利技术第一方面的方法,在所述步骤S2中,所述根据新能源的电站、设备、测
点位置和地理位置,自顶向下构建所述物件域知识图谱的方法包括:
[0015]对所述三元组进行知识抽取:对新能源的电站、设备、测点位置和地理位置的实体及属性进行抽取;对新能源的电站的实体和属性的关系进行抽取;
[0016]对抽取到的实体、属性和实体和属性的关系进行知识融合;
[0017]对知识融合后的实体、属性及关系进行间接实体关系的复核处理,即提出所述间接实体关系,得到物件域知识图谱。
[0018]根据本专利技术第一方面的方法,在所述步骤S2中,所述电站的实体和属性的关系包括:
[0019]因果关系,指原因造成结果的逻辑关系;
[0020]从属关系,指部件和设备之间的关系;
[0021]包含关系,指概念和现象上的包含关系;
[0022]作用关系,指设备起到的某些作用;
[0023]并列关系,指设备、部件之间的并列关系;
[0024]先后关系,指设备之间的先后顺序;
[0025]全同关系,指不同的词组代表相同的词义;
[0026]位置关系,表示位置上的关系;
[0027]交叉条件,指设备属于一个序列时,就不会属于另一个序列;
[0028]其他关系,不能用以上关系直接表达的关系。
[0029]根据本专利技术第一方面的方法,在所述步骤S3中,所述异常事件域知识图谱包括:异常数据事件的唯一标识、数据类型、数据阈值、异常数据发生的时间戳、异常数据发生所在的具体测点位置和异常数据类型描述。
[0030]根据本专利技术第一方面的方法,在所述步骤S3中,所述根据时序数据曲线、日志文件和气象数据,由底向上构建异常事件域知识图谱的方法包括:
[0031]根据时序数据曲线、日志文件和气象数据,建立异常数据类型库;
[0032]在异常数据类型库中,根据数据项及数据类型,采用预定义方法设定数据的阈值;
[0033]按照电站KKS编码,为每个异常数据的测点赋予唯一的标码,即异常数据事件的唯一标识;
[0034]根据数据项和数据类型,选择预定义的算法,按照设定的阈值,进行异常数据判别,选取出异常数据,生成异常数据集合,即异常事件域知识图谱。
[0035]根据本专利技术第一方面的方法,在所述步骤S3中,所述异常数据类型库包括数据项、数据类型、数据阈值和数据异常类型;所述数据项包括发电功率、发电量、电流值和电压值;所述数据类型包括整数型、浮点型、字符型和布尔型;所述数据异常类型包括空值、错误值、负值、跳变值和极值。
[0036]本专利技术第二方面公开了一种识别新能源异常数据的知识图谱构建系统,所述系统包括:
[0037]第一处理模块,被配置为,由物件域知识图谱和异常事件域知识图谱组成新能源异常数据知识图谱的总体架构,即G=(E,R,S,U);所述物件域知识图谱由三元组构成,即G=(E,R,S);U为异常事件域知识图谱,代表异常数据的类型及情况;
[0038]第二处理模块,被配置为,根据新能源的电站、设备、测点位置和地理位置,自顶向
下构建所述物件域知识图谱;
[0039]第三处理模块,被配置为,根据时序数据曲线、日志文件和气象数据,由底向上构建异常事件域知识图谱;
[0040]第四处理模块,被配置为,将所述物件域知识图谱与异常事件域知识图谱进行关联,得到新能源异常数据总体知识图谱G=(E,R,S,U)。
[0041]根据本专利技术第二方面的系统,所述第二处理模块,被配置为,所述物件域知识图谱由若干个三元组组成,表示“实体—关系—实体”、“实体—关系—属性”或者“概念—属性—属性值”;
[0042]所述实体包括:电站和设备;
[0043]所述概念包括:地域、电站类型、设备类型、季节、月份和天气类型;
[0044]所述属性包括:电站的容量、经纬度、并网时间、并网电压等级和所属企业,设备的厂家和型号及天气类型中的雨量大小;
[0045]所述属性值指物件域实体对象或者概念相关属性的值。
[0046]根据本专利技术第二方面的系统,所述第二处理模块,被配置为,所述根据新能源的电站、设备、测点位置和地理位置,自顶向下构建所述物件域知识图谱包括:
[0047]对所述三元组进行知识抽取:对新能源的电站、设备、测点位置和地理位置的实体及属性进行抽取;对新能源的电站的实体和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别新能源异常数据的知识图谱构建方法,其特征在于,所述方法包括:步骤S1、由物件域知识图谱和异常事件域知识图谱组成新能源异常数据知识图谱的总体架构,即G=(E,R,S,U);所述物件域知识图谱由三元组构成,即G=(E,R,S);U为异常事件域知识图谱,代表异常数据的类型及情况;步骤S2、根据新能源的电站、设备、测点位置和地理位置,自顶向下构建所述物件域知识图谱;步骤S3、根据时序数据曲线、日志文件和气象数据,由底向上构建异常事件域知识图谱;步骤S4、将所述物件域知识图谱与异常事件域知识图谱进行关联,得到新能源异常数据总体知识图谱G=(E,R,S,U)。2.根据权利要求1所述的一种识别新能源异常数据的知识图谱构建方法,其特征在于,在所述步骤S2中,所述物件域知识图谱由若干个三元组组成,表示“实体—关系—实体”、“实体—关系—属性”或者“概念—属性—属性值”;所述实体包括:电站和设备;所述概念包括:地域、电站类型、设备类型、季节、月份和天气类型;所述属性包括:电站的容量、经纬度、并网时间、并网电压等级和所属企业,设备的厂家和型号及天气类型中的雨量大小;所述属性值指物件域实体对象或者概念相关属性的值。3.根据权利要求2所述的一种识别新能源异常数据的知识图谱构建方法,其特征在于,在所述步骤S2中,所述根据新能源的电站、设备、测点位置和地理位置,自顶向下构建所述物件域知识图谱的方法包括:对所述三元组进行知识抽取:对新能源的电站、设备、测点位置和地理位置的实体及属性进行抽取;对新能源的电站的实体和属性的关系进行抽取;对抽取到的实体、属性和实体和属性的关系进行知识融合;对知识融合后的实体、属性及关系进行间接实体关系的复核处理,即提出所述间接实体关系,得到物件域知识图谱。4.根据权利要求3所述的一种识别新能源异常数据的知识图谱构建方法,其特征在于,在所述步骤S2中,所述电站的实体和属性的关系包括:因果关系,指原因造成结果的逻辑关系;从属关系,指部件和设备之间的关系;包含关系,指概念和现象上的包含关系;作用关系,指设备起到的某些作用;并列关系,指设备、部件之间的并列关系;先后关系,指设备之间的先后顺序;全同关系,指不同的词组代表相同的词义;位置关系,表示位置上的关系;交叉条件,指设备属于一个序列时,就不会属于另一个序列;其他关系,不能用以上关系直接表达的关系。5.根据权利要求1所述的一种识别新能源异常数据的知识图谱构建方法,其特...

【专利技术属性】
技术研发人员:艾宇飞徐琳贺铮董丰彦周晓义张克铭范丽珺李巍李行任延平王永刚
申请(专利权)人:中能融合智慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1