一种基于数据聚类的新能源结算数据异常检测与预警方法技术

技术编号:37547378 阅读:21 留言:0更新日期:2023-05-12 16:22
本发明专利技术涉及数据处理技术领域,涉及一种基于数据聚类的新能源结算数据异常检测与预警方法。本发明专利技术中通过对太阳能发电设备的产电数据信息收集,并将收集的数据进行分类对比,并在分类对比后,进行数据间的对比,降低太阳能产电设备存在的偶然性,通过数据检测的准确度,同时当产电设备出现故障后,产电的数据会和数据临界数值产生差异,其数据的增幅量发生改变,如此便可以获取每个产电设备组的产电情况,以便于在其中某个产电设备出现故障后,可以及时的发现并处理,保证装置的正常产电。保证装置的正常产电。保证装置的正常产电。

【技术实现步骤摘要】
一种基于数据聚类的新能源结算数据异常检测与预警方法


[0001]本专利技术涉及数据处理
,具体地说,涉及一种基于数据聚类的新能源结算数据异常检测与预警方法。

技术介绍

[0002]随着环保意识的不断提高,新能源电力也开始进入到环保的行列,为了提高新能源在电力中所占的比重,建立了大量的风力发电、太阳能发电、潮汐发电等产电装置来代替原先的产电方式,同时为了惠及人民,在百姓家安装太阳能发电装置,家庭使用不完的电量可以汇入电网来增加部分收入,如此在增大新能源电量在整体电量中的比重。
[0003]太阳能发电的方式,存在故障率低,易于维修、安装的好处,目前处于新能源电量的主要产电方式,故在太阳能发电的场所中,不需要对太阳能发电装置进行监视,唯有在太阳能发电装置出现故障才会对发电装置进行维修,而太阳能发电装置是通过多组太阳能板组成,当其中某个太阳能板出现故障时,其发电设置整体很难被发现,如此便会导致损坏的太阳能板出现长时间无人维修的情况,进而影响电量的产生,同时安装在居民家中的产电装置无法判断是否存在故障,当出现故障时,也无法进行维修,故需要一种系统对新能源结算数据进行异常检测,使发电设备在出现故障后,可以的到及时的维修。

技术实现思路

[0004]本专利技术的目的在于提供一种基于数据聚类的新能源结算数据异常检测与预警方法,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供一种基于数据聚类的新能源结算数据异常检测与预警方法,包括以下步骤:S1、按照新能源数据接收到的时间批次,为新能源数据赋予时间标志位flag1;对具有相同时间标志位flag1的新能源数据进行分间保存,并在保存数据的时候,为分间保存的数据赋予数据间标志位flag2;S2、对保存的数据进行数据类别的分类,并在有新的数据保存时,识别保存的数据内容,并根据识别的内容,对数据进行归纳;S3、对每个时间批次的数据进行处理,并建立新能源标准数据间,以制定的新能源标准数据为数据临界数值,为同一时间批次多个数据来源端传输来的信息赋予来源端标志位flag3,并对具有相同数据间标志位flag2的新能源数据和新能源标准数据对比,并在对比后将此次对比的数据和上次对比的数据进行比对;S4、设置比对数据间,并将每个数据间的数据进行整合再进行比对,分析同一来源的新能源数据是否正常。
[0006]作为本技术方案的进一步改进,在所述S1执行的过程中,分批保存时,使同一数据间内的新能源数据之间无相关性,包括:建立具有时间标志位flag1、来源端标志位flag2和数据间标志位flag3的映射规则,所述映射规则满足约束条件:
T1:将批存储器的按地址序号由小至大排序;T2:对于具有相同时间标志位flag1的数据,识别其来源端标志位flag2;T3:对于具有相同来源端标志位flag2的数据,按顺序存入批存储器,并赋予数据间标志位flag3。
[0007]作为本技术方案的进一步改进,执行所述S2时的具体步骤如下:S2.1、提取S1中保存的数据,提取的数据为同一数据来源端传输来的数据,并将提取的数据按照时间的顺序进行排序;S2.2、对排序的数据进行顺序性的整理,将数据中不同类别的数据分开识别,并将同类别的数据整合在一起;所述S2.2中将数据中不同类别的数据分开识别的方法采用数据匹配算法,其算法步骤为:设域A为任意一个数据间中的新能源数据集合,域B为新能源标准数据间中的新能源数据集合,计算域A相对于域B的异常度Y,所述异常度Y满足:
[0008]为域A和域B的相似度,满足:;为域A相对于域B的差异度,满足:;为域B相对于域A的差异度,满足:;其中,表示域A和域B的交集,表示域A和域B的并集,A\B表示域A对域B的差集,B\A表示域B对域A的差集;异常度Y满足边界条件:X1:当域A数据无异常时,,则;X2:当域A数据存在异常时,且,则。
[0009]作为本技术方案的进一步改进,在所述S3执行时的具体步骤如下:S3.1、按照每个数据来源的标准数据进行新能源标准数据的制定,并将制定新能源标准数据作为数据临界数值;S3.2、按照S2.2中数据排序的顺序,数据在对比时采用逐级对比的方法进行对比,在对比的过程中,将同一数据来源的数据和新能源标准数据对比,确定数据和数据临界数值之间的比例关系,并在比例关系确定后,本次对比的得到的比例关系和上次对比的得到的比例关系进行比较,获得本次数据的增幅情况;S3.3、将本次对比得到的比例关系和上次对比得到的比例关系进行比较,对数据变动幅度过大的数据进行单独的提取,并在提取后,将提取的数据从对比的数据中删除掉,对比留下的数据按照批次顺序进行保存。
[0010]作为本技术方案的进一步改进,对所述S3.3中的数据变动幅度过大的数据进行单独的提取时,判断数据变动幅度的依据为制定数据变动幅度范围,其数据变动幅度的范围由数据来源的标准数据为中点,并根据新能源数据来源的工作情况设置以标准数据为中点的浮动区间。
[0011]作为本技术方案的进一步改进,所述S4在执行的具体内容如下:S4.1、将S3.3中按照批次顺序保存的数据进行分组,分出来的每组为对比数据间,
将每个数据间中数据的最大值和最小值进行去除,并将保留下来的数据进行平均值的计算;S4.2、将计算出平均值的数据间进行对比,计算出上一个对比间的平均值和本次计算出来的数据间的平均值的振幅量;S4.3、将计算出来的振幅量数值和数据变动幅度进行对比,判断计算出来的振幅量数值是否在数据变动幅度之内。
[0012]作为本技术方案的进一步改进,所述S4.3中在判断计算出来的振幅量数值是否在数据变动幅度之内的结果有两种:结果一:计算出来的振幅量数值在数据变动幅度之内,此时表面新能源数据正常,无需进行其他操作;结果二:计算出来的振幅量数值不在数据变动幅度之内,此时表面新能源数据出现异常,此时进行预警,对对应的新能源数据传输端的设备进行检查维修。
[0013]作为本技术方案的进一步改进,所述S4.2中计算出上一个对比间的平均值和本次计算出来的数据间的平均值的振幅量的公式为:
[0014]式中,为本次计算出来的数据间的平均值,为计算出上一个对比间的平均值,为本次计算出来的数据间的平均值相对于计算出上一个对比间的平均值的振幅量。
[0015]与现有技术相比,本专利技术的有益效果:该基于数据聚类的新能源结算数据异常检测与预警方法中,通过对太阳能发电设备的产电数据信息收集,并将收集的数据进行分类对比,并在分类对比后,进行数据间的对比,降低太阳能产电设备存在的偶然性,通过数据检测的准确度,同时当产电设备出现故障后,产电的数据会和数据临界数值产生差异,其数据的增幅量发生改变,如此便可以获取每个产电设备组的产电情况,以便于在其中某个产电设备出现故障后,可以及时的发现并处理,保证装置的正常产电。
附图说明
[0016]图1为本专利技术的整体流程示意框图。
具体实施方式
[0017]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据聚类的新能源结算数据异常检测与预警方法,其特征在于:包括以下步骤:S1、按照新能源数据接收到的时间批次,为新能源数据赋予时间标志位flag1;对具有相同时间标志位flag1的新能源数据进行分间保存,并在保存数据的时候,为分间保存的数据赋予数据间标志位flag2;S2、对保存的数据进行数据类别的分类,并在有新的数据保存时,识别保存的数据内容,并根据识别的内容,对数据进行归纳;S3、对每个时间批次的数据进行处理,并建立新能源标准数据间,以制定的新能源标准数据为数据临界数值,为同一时间批次多个数据来源端传输来的信息赋予来源端标志位flag3,并对具有相同数据间标志位flag2的新能源数据和新能源标准数据对比,并在对比后将此次对比的数据和上次对比的数据进行对比;S4、设置对比数据间,并将每个数据间的数据进行对比,分析同一来源的新能源数据是否正常。2.根据权利要求1所述的基于数据聚类的新能源结算数据异常检测与预警方法,其特征在于:在所述S1执行的过程中,分批保存时,使同一数据间内的新能源数据之间无相关性,包括:建立具有时间标志位flag1、来源端标志位flag2和数据间标志位flag3的映射规则,所述映射规则满足约束条件:T1:将批存储器的按地址序号由小至大排序;T2:对于具有相同时间标志位flag1的数据,识别其来源端标志位flag2;T3:对于具有相同来源端标志位flag2的数据,按顺序存入批存储器,并赋予数据间标志位flag3。3.根据权利要求1所述的基于数据聚类的新能源结算数据异常检测与预警方法,其特征在于:执行所述S2时的具体步骤如下:S2.1、提取S1中保存的数据,提取的数据为同一数据来源端传输来的数据,并将提取的数据按照时间的顺序进行排序;S2.2、对排序的数据进行顺序性的整理,将数据中不同类别的数据分开识别,并将同类别的数据整合在一起;所述S2.2中将数据中不同类别的数据分开识别的方法采用数据匹配算法,其算法步骤为:设域A为任意一个数据间中的新能源数据集合,域B为新能源标准数据间中的新能源数据集合,计算域A相对于域B的异常度Y,所述异常度Y满足:;为域A和域B的相似度,满足:;为域A相对于域B的差异度,满足:;为域B相对于域A的差异度,满足:;其中,表示域A和域B的交集,表示域A和域B的并集,A\B表示域A对域B的差集,B\A表示域B对域A的差集;异常度Y满足边界条件:
X1:当域A数据无异常时,,则Y=0;X2:当域A数据存在异常时,且,则。4.根据权利要求3所述的基于数据聚类的新能源结算数...

【专利技术属性】
技术研发人员:徐旸吴剑吴斌杰王晓翔林武星傅悦胡嘉骅殷骁哲张韦维潘若真蔡永自白亚伟刘琦
申请(专利权)人:国网浙江省电力有限公司绍兴供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1