适用于无线传感器网络的异常数据检测方法技术

技术编号:19152952 阅读:31 留言:0更新日期:2018-10-13 10:53
本发明专利技术揭示了一种适用于无线传感器网络的异常数据检测方法,包括网络节点的分簇:根据分簇算法将采集数据相关的节点分在一个组中,并选出该组节点的一个簇头节点;双重检测:每个节点通过训练数据集结合PCA算法得到自分区阀值,并由对应簇的簇头节点计算得到全局区分阀值,任意节点在检测到新数据后基于自区分阀值和全局区分阀值进行检测;检测模型更新:随新的检测数据更改训练数据集的构成。本发明专利技术充分利用无线传感器网络节点感知数据之间的时间和空间相关的特点,基于PCA提出了局部检测和全局检测相结合的双重检测机制,并提出了异常检测模型的更新方案,大大提高了异常检测模型的可靠性。该方案更加适用于实际场景中传感器网络异常数据的检测。

Anomaly data detection method for Wireless Sensor Networks

The invention discloses an anomaly data detection method suitable for wireless sensor networks, including clustering of network nodes: according to clustering algorithm, the nodes related to the collected data are divided into a group, and a cluster head node of the group is selected; double detection: each node is obtained by training data set combined with PCA algorithm Self-partitioning threshold is calculated by cluster head node of corresponding cluster, and any node detects the new data based on Self-distinguishing threshold and global distinguishing threshold; detection model updates: changes the composition of training data set with the new detection data. The invention makes full use of the characteristics of time and space correlation between sensor data in wireless sensor network nodes, proposes a dual detection mechanism based on PCA, which combines local detection with global detection, and proposes an update scheme of anomaly detection model, which greatly improves the reliability of anomaly detection model. The scheme is more suitable for detecting abnormal data in sensor networks in actual scenarios.

【技术实现步骤摘要】
适用于无线传感器网络的异常数据检测方法
本专利技术涉及一种网络异常的检测方法,具体涉及一种针对密集部署的无线传感器网络的异常数据检测方法。
技术介绍
随着网络技术的日新月异,现有针对无线传感器网络异常数据检测方案主要分为两种,即集中式检测方案和分布式检测方案。具体分析其特征和优缺点:其中集中式检测方案的核心思想是将各个节点的检测数据统一地发送到汇聚节点,汇聚节点接收各个节点传送过来的数据,根据汇聚节点的异常数据检测模型提取异常数据,并且定位到相应的异常节点。这种方法的优点是每个传感器节点不需要额外的计算开销,只需要将数据传递给汇聚节点。但是这种方案的缺点也很明显:(1)汇聚节点的处理能力要很强,一旦汇聚节点被攻击,那么整个网络将难以避免地瘫痪。(2)每个节点都需要将自己的数据传送给汇聚节点,节点能量随着频繁的通信而迅速消耗,也很容易导致整个网络瘫痪(需要注意的是节点之间进行通信是最消耗节点能量的)。由于集中式检测方案使得网络的健壮性非常差,因此现阶段主要用的都是分布式检测方案。分布式检测方案的核心思想是让各个节点都能够自动检测异常数据,这样一来不仅可以解决网络中通信频繁的问题,也可以保证网络中一个节点出问题不会使网络瘫痪,大大提高了网络的健壮性和生命周期。然而这种方案也有明显的缺陷:(1)网络中每一个节点都需要额外的计算资源,如果计算耗费的资源很高,那么节点很快就会成为死节点。(2)每一个节点只根据自己所建立的模型来检测异常数据,存在误报率较高,检测率较低的情况。目前主流的分布式检测方案包括:基于支持向量机(SVM)的检测方案,基于分类器的检测方案,基于主成分分析(PCA)的检测模型。横向比较来看,基于SVM的检测方案计算较为复杂,而且根据内核函数的选取不同,异常数据的检测率和误报率会有很大差别,这种方案下内核函数的选取尤为重要。基于分类器的检测方案能够达到较高的异常数据检测率和较低的误报率,但是此方案需要提供异常数据和正常数据来训练分类器,而通常情况下只拥有正常的数据去训练数据模型。基于主成分分析的检测方案根据数据向量的特征分量建立检测模型,只需要提供正常数据。这些方案虽然计算并不复杂,但是异常数据的误报率偏高,检测率相对较低。
技术实现思路
鉴于此,本专利技术的目的旨在提出一种适用于无线传感器网络的异常数据检测方法,解决此类网络异常数据检测中计算资源分配不合理、误报率较高、检测率较低的问题。本专利技术解决上述问题所采用的技术方案为:适用于无线传感器网络的异常数据检测方法,其特征在于包括步骤:网络节点的分簇:根据分簇算法将采集数据相关的节点分在一个组中,并在这个组中选出一个簇头节点进行该组节点数据的传送和处理;双重检测:每个节点通过训练数据集结合PCA算法得到自分区阀值,并由对应簇的簇头节点计算得到全局区分阀值,任意节点在检测到新数据后基于自区分阀值和全局区分阀值进行检测;检测模型更新:设定检测模型中初始训练数据集由m个时间窗口中的正常数据构成,其中m为大于2的整数,随新的检测数据到来,训练数据集由当前m个窗口时间内的正常数据构成。进一步地,其特征在于还包括方案评估:利用拟合的数据集、英特尔伯克利实验室采集的传感器数据集对自定义时段内的双重检测结果进行分析和仿真,进行评估,其中自定义时段为检测模型更新周期的s倍,s为大于5的整数。进一步地,所述分簇算法为GAF分簇算法、拓扑发现算法、LEACH算法、HEED算法、分簇算法,能量平衡拓扑发现算法中的一种。进一步地,所述双重检测分为局部检测和全局检测,其中局部检测为当某个节点检测到新数据时,本节点计算新数据向量到最大主成分分量的投影距离,并与本节点的自区分阀值比较,对于小于自区分阀值的新数据判定为正常数据,对于超出自区分阀值的新数据判定为可疑数据并发送对应的计算结果至簇头节点中与全局区分阈值比较,对于大于全局区分阈值的新数据标记为异常数据,对于小于全局区分阀值的新数据判定为正常数据。更进一步地,所述双重检测的细分步骤包括:异常检测模型的建立,每个节点和簇头节点分别使用三元组建立各自的异常数据检测模型;异常数据检测,每个节点计算自身最大主成分分量和最大投影距离,并广播至相关联的簇头节点中;簇头节点根据相关联的全部节点的最大投影距离计算全局最大投影距离;异常数据源检测,对异常数据分析引发的原因,包括简单的噪声或内部错误。与现有技术相比,本专利技术具有突出的实质性特点和显著的进步性,其有益效果体现为:本专利技术在已有的PCA分布式检测方案上,提出可靠性更高的检测方案。该方案结合已有PCA方案的优势,仅需要使用正常数据来训练检测模型并且拥有较低的计算复杂度。同时在已有技术的基础上,通过考虑邻居节点之间数据的相关性,通过双重检测机制有效地降低了异常数据的误报率。为了保持检测模型的可靠性,对检测模型进行定时的更新来满足网络的实时变化,有效地提高网络异常数据检测率。对该方案评估如下:每个节点消耗的计算资源较少,只需要正常数据训练检测模型,同时该方案有效地提高了网络中异常数据的检测率,降低了异常数据的误报率,有效地识别网络中是否有异常事件发生。附图说明图1以s0为簇头节点的网络结构。图2数据向量到第一主成分的距离示意图。图3异常数据检测模型的更新过程示意图。图4训练数据集合和待检测数据集合的对比示意图。图5拟合数据下模型的性能分析。图6不同时间窗口下模型异常数据检测率比较。图7不同的信噪比下模型的误报率比较.具体实施方式下面结合附图进一步详细描述本专利技术的技术方案,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。1、网络节点的分簇无线传感器网络中经典的分簇算法主要包括:Santi的改进GAF(GeographicalAdaptiveFidelity)分簇算法、Deb的TopDisc(TopologyDiscovery)拓扑发现算法、Heinzelman的LEACH(LOWEnergyAdaptiveClusteringHierarchy)算法和Younis的HEED算法等。其中最经典的是最小支配集理论TopDisc算法,该算法采用贪心算法来选取网络中的骨干节点,具体分为两种类型:三色法和四色法。有学者对该方案进行改进,提出了Power-BalancedTopDisc算法,该方法充分考虑了网络中节点的剩余能量,有效地提高网络的生命期。本方案中采取Power-Balanced算法分簇。如图1所示,根据分簇算法将采集数据相关的节点(S1-S6)分在一个组中,并在这个组中选出一个簇头节点s0进行该组节点数据的传送和处理。2、双重检测机制主成分分析法(PrimaryComponentsAnalysis)简称为PCA算法。PCA算法在数据挖掘领域和人脸识别中起了非常重要的作用,算法的核心思想是对数据进行降维,通过将一组具有相关性的变量转化为一组线性无关的变量,转换之后的变量叫做主成分分量。无线传感器网络中监测的数据一般是多维的数据,例如IntelBerkeleyResearchLab项目组监测的数据就包括:温度、湿度、电压、光照强度等数据。对数据进行降维,不仅能够保留数据向量的基本特征,还可以大大降低数据的处理复杂度,降低网络的通信开销。在本方案中通过PCA算法和训练数据集获取最大主成分分本文档来自技高网
...

【技术保护点】
1.适用于无线传感器网络的异常数据检测方法,其特征在于包括步骤:网络节点的分簇:根据分簇算法将采集数据相关的节点分在一个组中,并在这个组中选出一个簇头节点进行该组节点数据的传送和处理;双重检测:每个节点通过训练数据集结合PCA算法得到自分区阀值,并由对应簇的簇头节点计算得到全局区分阀值,任意节点在检测到新数据后基于自区分阀值和全局区分阀值进行检测;检测模型更新:设定检测模型中初始训练数据集由m个时间窗口中的正常数据构成,其中m为大于2的整数,随新的检测数据到来,训练数据集由当前m个窗口时间内的正常数据构成。

【技术特征摘要】
1.适用于无线传感器网络的异常数据检测方法,其特征在于包括步骤:网络节点的分簇:根据分簇算法将采集数据相关的节点分在一个组中,并在这个组中选出一个簇头节点进行该组节点数据的传送和处理;双重检测:每个节点通过训练数据集结合PCA算法得到自分区阀值,并由对应簇的簇头节点计算得到全局区分阀值,任意节点在检测到新数据后基于自区分阀值和全局区分阀值进行检测;检测模型更新:设定检测模型中初始训练数据集由m个时间窗口中的正常数据构成,其中m为大于2的整数,随新的检测数据到来,训练数据集由当前m个窗口时间内的正常数据构成。2.根据权利要求1所述适用于无线传感器网络的异常数据检测方法,其特征在于还包括方案评估:利用拟合的数据集、英特尔伯克利实验室采集的传感器数据集对自定义时段内的双重检测结果进行分析和仿真,进行评估,其中自定义时段为检测模型更新周期的s倍,s为大于5的整数。3.根据权利要求1所述适用于无线传感器网络的异常数据检测方法,其特征在于:所述分簇算法为GAF分簇算法、拓扑发现算法、LEACH算法、H...

【专利技术属性】
技术研发人员:杨立君郑文添吴蒙
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1