一种物联网监测点相邻关系的判定方法技术

技术编号:20875021 阅读:16 留言:0更新日期:2019-04-17 11:15
一种物联网监测点相邻关系的判定方法,所述方法首先读取设定时间窗口内各个监测点的历史监测数据,得到监测数据序列集,然后采用多种聚类算法对监测数据序列集中的监测数据序列进行聚类,且每种聚类算法均通过改变簇数量得到多个聚类结果,之后计算每种聚类结果的轮廓系数,并将轮廓系数最大的聚类结果作为最优结果,最后根据最优结果来判断物联网监测点的相邻关系。本发明专利技术基于历史监测数据,使用聚类算法,根据各监测点数据之间的内在相似性来确定其逻辑相邻关系,实验结果显示,该方法所判定的监测点相邻关系稳定,相比传统方法更加符合客观实际,能够为物联网监测数据有效性审核及其它数据处理提供更加科学合理的依据。

【技术实现步骤摘要】
一种物联网监测点相邻关系的判定方法
本专利技术涉及一种基于聚类的物联网监测点相邻关系的分析与判定方法,属于数据挖掘和物联网监测

技术介绍
在目前的各类物联网监测系统中,由于受到感知设备和传输网络故障、甚至人为故意等因素的影响,普遍存在着大量的无效或异常数据。比如在大气质量实时监测系统中,大约存在0.95%~3.18%的各类异常数据。这些异常数据影响整体数据的可用性,需要进行数据有效性审核。在判定数据异常以及对异常数据进行修正时,通常需要参照邻居监测点的同类监测值。例如,在发现异常数据时,使用邻居监测点的监测数据平均值(一般性处理)或最大值(惩罚性处理)对异常值进行修正。因此,判定物联网监测点的相邻关系,是物联网监测异常数据处理中一个必须解决的基本问题。现有的物联网监测数据处理系统一般是根据监测点所属的行政区域或所在地理位置作为相邻关系的判定依据。这种判定方法含义直观且实现简单,但由于很多行政区域的形状很不规则,部分监测点与同一相邻区域内的其它节点地理距离过远,其监测值在异常数据判定和异常值修正时的参照价值不大,加之监测对象复杂多变,致使现有的方法并不能很好地满足实际需要,因此有必要探索更加科学合理的判定方法。
技术实现思路
本专利技术的目的在于针对现有技术之弊端,提供一种物联网监测点相邻关系的判定方法,为物联网监测数据的有效性审核提供更加科学合理的依据。本专利技术所述问题是以下述技术方案实现的:一种物联网监测点相邻关系的判定方法,所述方法首先读取设定时间窗口内各个监测点的历史监测数据,得到监测数据序列集,然后采用多种聚类算法对监测数据序列集中的监测数据序列进行聚类,且每种聚类算法均通过改变簇数量得到多个聚类结果,之后计算每种聚类结果的轮廓系数,并将轮廓系数最大的聚类结果作为最优结果,最后根据最优结果来判断物联网监测点的相邻关系。上述物联网监测点相邻关系的判定方法,所述方法包括以下步骤:a.提取监测数据首先设定时间窗口,然后读取设定时间窗口内各个监测点的历史监测数据,假设有K个监测点,用Di表示从第i个监测点读取的监测数据序列,得到监测数据序列集D={D1,D2,……DK};b.确定簇数量设定聚类结果簇数范围为n1~n2,n1和n2均为自然数,且n1<n2;c.进行聚类分析①指定聚类算法集合;②将簇数量设为n1③对监测数据序列集中的监测数据序列依次采用指定聚类算法集合中的各种聚类算法进行聚类;④将簇数量的数值加1,重复步骤③的操作,直至簇数量为n2;⑤计算各个聚类结果的轮廓系数;d.判定相邻关系选取轮廓系数最大的聚类结果作为最优结果,则最优结果中归入同一簇的监测点互为相邻监测点。上述物联网监测点相邻关系的判定方法,对监测数据序列集中的监测数据序列进行聚类时,各监测数据序列之间的距离的计算方法如下:对于监测数据序列集D={D1,D2,……DK}中的监测数据序列Di和Dj,定义两者之间的距离为:其中n为监测数据序列长度,Dim为监测数据序列Di中的第m维数据,Djm为监测数据序列Dj中的第m维数据。上述物联网监测点相邻关系的判定方法,聚类结果的轮廓系数的计算方法如下:数据集中第i个对象的轮廓系数为:其中,ai是第i个对象到它所在的簇中其它对象的平均距离,bi是第i个对象到其它簇的平均距离中的最小值;计算数据集中所有对象的轮廓系数的平均值,得到聚类结果的轮廓系数。上述物联网监测点相邻关系的判定方法,设定聚类结果的簇数范围时,n1和n2的平均值为最接近的数,其中K是监测点的个数。本专利技术基于历史监测数据,使用聚类算法,根据各监测点数据之间的内在相似性来确定其逻辑相邻关系,实验结果显示,该方法所判定的监测点相邻关系稳定并且具有良好的可解释性,相比传统方法更加符合客观实际,能够为物联网监测数据有效性审核及其它数据处理提供更加科学合理的依据。附图说明下面结合附图对本专利技术作进一步详述。图1是本专利技术的流程图;图2是监测点分布图。具体实施方式物联网监测点的相邻关系的有关知识定义1.监测点的相邻关系:在物联网监测点集合A上定义的等价关系R,满足自反性、对称性和传递性,称作监测点的一个相邻关系。定义2.监测点的相邻区域:物联网监测点a在监测点集合A上形成的R等价类[a]R,称作监测点a的相邻区域。定义3.监测点的邻居节点:物联网监测点集合A中,与监测点a同属一个相邻区域的其它监测点,称作监测点a的邻居节点。定义4.监测点的相邻分区:物联网监测点集合A的一个划分,称作监测点的一种相邻分区。关于物联网监测点的相邻关系,有以下定理。定理1:物联网监测点集合A关于相邻关系R的商集A/R,是监测点集合A的一种相邻分区。证明:商集A/R是相邻关系R的等价类集合,即,A/R={[x]R|x∈A}其中等价类[x]R={y∈A|(x,y)∈R}。而A的划分是其非空子集的集合{Ai},且满足以下条件:AiIAj=φ,i≠j;YAi=A。下面证明商集A/R是监测点集合A的一个划分。首先,有[x]R非空;其次,若[x]R≠[y]R,则有[x]RI[y]R=φ;最后,有故又有所以由上可知,商集A/R是监测点集合A的一个划分.根据定义4,物联网监测点集合A关于相邻关系R的商集A/R,是监测点集合A的一种相邻分区。性质1:监测点的相邻分区是一个相邻区域集合。根据定理1,商集A/R是监测点集合A的一个相邻分区。因为商集A/R是相邻关系R的等价类集合,所以相邻分区是一个R等价类集合。又根据定义2,相邻区域是R等价类。所以监测点的相邻分区是一个相邻区域集合。性质2:一个相邻关系对应一种相邻分区;一种相邻分区对应一个相邻关系。根据定义1,相邻关系是监测点集合A上的一个等价关系。根据定义4,相邻分区是监测点集合A的一个划分。由等价关系和划分之间的一一对应关系,可知一个相邻关系对应一种相邻分区;一种相邻分区对应一个相邻关系。由前述定理和性质可知,对于物联网监测点集合,只要给定一个相邻关系,就可以确定一种相邻分区,进而确定各个监测点所在的相邻区域及其邻居节点。定义5.监测点的行政邻居节点:把监测点相邻关系定义为属于同一行政区域,与监测点a具有该相邻关系的监测点称作监测点a的行政邻居节点。例如,将同一市级行政区域内的监测点划分为一个相邻区域。这种相邻关系判定方法的好处是与各监测点行政管辖体制保持一致,便于管理。但是很多行政区域的形状很不规则,这会导致部分监测点与同一相邻区域内的其它节点地理距离过远,其监测值在异常数据判定和异常值修正时的参照价值不大。定义6.监测点的地理邻居节点:在监测范围内选定若干地理中心点,把监测点相邻关系定义为与地理中心点距离小于指定值。与监测点a具有该相邻关系的监测点称作监测点a的地理邻居节点。这种相邻关系判定方法能够避免行政区域形状不规则所导致的问题。但是通过分析实际监测数据可以发现,地理距离相近的监测点,其监测数据的差别也可能很大;地理距离较远的监测点,也存在数据相近的现象。例如在大气质量监测中,由于其影响因素众多,且影响机制复杂。部分地理位置距离很近的监测点,其周边的大气质量却相差很大,也不适合相互参照。定义7.监测点的物理邻居节点:使用物联网监测点在现实世界中已经存在的某种关系作为相邻关系,把据此确定的邻居节点,称作监测点的物理邻居节本文档来自技高网...

【技术保护点】
1.一种物联网监测点相邻关系的判定方法,其特征是,所述方法首先读取设定时间窗口内各个监测点的历史监测数据,得到监测数据序列集,然后采用多种聚类算法对监测数据序列集中的监测数据序列进行聚类,且每种聚类算法均通过改变簇数量得到多个聚类结果,之后计算每种聚类结果的轮廓系数,并将轮廓系数最大的聚类结果作为最优结果,最后根据最优结果来判断物联网监测点的相邻关系。

【技术特征摘要】
1.一种物联网监测点相邻关系的判定方法,其特征是,所述方法首先读取设定时间窗口内各个监测点的历史监测数据,得到监测数据序列集,然后采用多种聚类算法对监测数据序列集中的监测数据序列进行聚类,且每种聚类算法均通过改变簇数量得到多个聚类结果,之后计算每种聚类结果的轮廓系数,并将轮廓系数最大的聚类结果作为最优结果,最后根据最优结果来判断物联网监测点的相邻关系。2.根据权利要求1所述的一种物联网监测点相邻关系的判定方法,其特征是,所述方法包括以下步骤:a.提取监测数据首先设定时间窗口,然后读取设定时间窗口内各个监测点的历史监测数据,假设有K个监测点,用Di表示从第i个监测点读取的监测数据序列,得到监测数据序列集D={D1,D2,……DK};b.确定簇数量设定聚类结果簇数范围为n1~n2,n1和n2均为自然数,且n1<n2;c.进行聚类分析①指定聚类算法集合;②将簇数量设为n1③对监测数据序列集中的监测数据序列依次采用指定聚类算法集合中的各种聚类算法进行聚类;④将簇数量的数值加1,重复步骤③的操作,直至簇数量为n2;⑤计算各个聚...

【专利技术属性】
技术研发人员:李永飞田立勤赵巧芳陈振国郭晓欣王德志王养廷
申请(专利权)人:华北科技学院
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1