基于数据挖掘的安全检查标准库动态更新方法技术

技术编号:14778227 阅读:49 留言:0更新日期:2017-03-09 14:09
本发明专利技术公开了一种基于数据挖掘的安全检查标准库动态更新方法,包括:从安全检查结果库提取出N种特征合成得到N维向量;对N维向量进行归一化处理得到数据集合;使用canopy算法对数据集合进行聚合得到第一聚类,根据第一聚类的K值;根据K值使用K‑Means算法对数据集合进行聚类直到中心点收敛或达到预设要求,得到多个类簇;根据预设向量相似度阈值确定每个类簇中的关键元素,根据关键元素提炼出导致系统运行安全隐患的关键属性,当安全检查结果库中新检查项的关键属性的数量大于预设关键属性数量阈值时,将新检查项加入到安全检查标准库中。本发明专利技术具有如下优点:缩短了更新时间,自动对新的检查项判断是否加入安全检查标准库。

【技术实现步骤摘要】

本专利技术涉及电力系统安全检查自动化领域,具体涉及一种基于数据挖掘的安全检查标准库动态更新方法
技术介绍
随着社会经济的快速发展,电网建设也步入高速发展的时期,电网规模已经达到较高水平,电网结构日趋复杂。电力设备数量快速增长,电力系统中运行的设备产生的数据信息量急剧增加。在此情况下保证电网安全稳定的运行是电网动作的重中之重,而安全检查是保证电网安全运行的重要环节之一。传统的安全检查是相关工作人员根据安全检查标准库中的内容逐项对各检查项定期或者不定期进行检查或抽查,然而随着电网规模的增大传统的安全检查标准库已经跟不上电网系统运行安全生产检查项的更新速度及结构的复杂程度,难免会产生疏漏之处,或者检查项长期不更新就会造成工作效率低或者重复劳动。
技术实现思路
本专利技术旨在至少解决上述技术问题之一。为此,本专利技术的目的在于提出一种基于数据挖掘的安全检查标准库动态更新方法,保证电网安全运行。为了实现上述目的,本专利技术的实施例公开了一种基于数据挖掘的安全检查标准库动态更新方法,包括以下步骤:S1:从安全检查结果库提取出N种特征,将多种特征合成得到N维向量,其中,N为自然数;S2:对N维向量进行归一化处理得到数据集合;S3:使用canopy算法对所述数据集合进行聚合得到第一聚类,根据所述第一聚类的K值;S4:根据K值使用K-Means算法对所述数据集合进行聚类直到中心点收敛或达到预设要求,得到多个类簇;S5:根据预设向量相似度阈值确定每个类簇中的关键元素,根据所述关键元素提炼出导致系统运行安全隐患的关键属性,当所述安全检查结果库中新检查项的所述关键属性的数量大于预设关键属性数量阈值时,将所述新检查项加入到所述安全检查标准库中。根据本专利技术实施例的基于数据挖掘的安全检查标准库动态更新方法,通过K-Means算法分析出安全检查结果库中的重要检查项更新到安全检查标准库中,当安全检查结果库中出现新的检查项时,计算此检查项数据与安全检查结果库中已有的检查项的匹配度,然后计算出对应的解决方案;根据数据挖掘技术当一个新的检查项出现时进行分析并做出判断,从而缩短了更新时间;当出现一个新的检查项时就及时做出分析判断,从而决定是否对安全检查标准库进行更新。另外,根据本专利技术上述实施例的基于数据挖掘的安全检查标准库动态更新方法,还可以具有如下附加的技术特征:进一步地,通过以下公式进行归一化处理:其中,为归一化结果,ui为xi维度上的均值,为xi维度上的标准差。进一步地,步骤S3进一步包括:S301:设定距离阈值T1和第二距离T2,且距离阈值T1大于距离阈值T2;S302:从所述数据集合随机选定一个数据向量,计算所述选定数据向量与其它向量之间的距离H;S303:把距离H小于距离阈值T1的向量生成canopy,把距离H小于T2的向量从所述数据集合中删除;S304:重复执行步骤S302和S303,直至所述数据集合为空,从而得到所述第一聚类,根据所述第一聚类计算K值。进一步地,步骤S4进一步包括:S401:遍历所述数据集合,将每个数据划分到最近的中心点中;计算每个聚类的平均值,并作为新的中心点,其中,每个点到中心点的距离公式为:其中,xi为当前数据向量第i个向量分量,ki为聚类中心点地i个分量;S402:判断每个中心点是否收敛或达到预设要求,如果每个中心点不收敛且未达到预设要求,返回步骤S401。进一步地,步骤S5进一步包括:对每一个类簇中的对象向量,剔除其中的预设数量的向量分量;计算类簇内的剩余向量的向量相似度;如果所述剩余向量的向量相似度小于所述预设向量相似度阈值,则剔除的向量分量为关键元素;根据所述关键元素提炼出导致系统运行安全隐患的关键属性;当所述安全检查结果库中新检查项的关键属性的数量是否大于预设关键属性数量阈值时,将所述新检查项加入到所述安全检查标准库中。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术实施例的基于数据挖掘的安全检查标准库动态更新方法的流程图;图2是本专利技术一个实施例的基于数据挖掘的安全检查标准库动态更新方法的详细步骤的流程图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。参照下面的描述和附图,将清楚本专利技术的实施例的这些和其他方面。在这些描述和附图中,具体公开了本专利技术的实施例中的一些特定实施方式,来表示实施本专利技术的实施例的原理的一些方式,但是应当理解,本专利技术的实施例的范围不受此限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。以下结合附图描述本专利技术。图1是本专利技术实施例的基于数据挖掘的安全检查标准库动态更新方法的流程图,图2是本专利技术一个实施例的基于数据挖掘的安全检查标准库动态更新方法的详细步骤的流程图。如图1和图2所示,一种基于数据挖掘的安全检查标准库动态更新方法,包括以下步骤:S1:从安全检查结果库提取出N种特征,将多种特征合成得到N维向量(x1,x2,x3。。。。。,xn),其中,N为自然数。S2:对N维向量进行归一化处理得到数据集合。具体地,样本数据集合每一个维度都具有均值和单位方差。计算每一个维度上数据的均值和标准差,首先在每一个维度上与该均值求差,然后在数据的每个维度上与该维度上数据的标准差相除。具体如下:其中,为归一化结果,ui为xi维度上的均值,为xi维度上的标准差。S3:使用canopy算法对所述数据集合进行聚合得到第一聚类,根据所述第一聚类的K值。具体地,将新的安全检查项数据向量化得到一个结果集list后放入内存中,S301:选择距离阈值T1和距离阈值T2,其中距离阈值T1>距离阈值T2;S302:从数据集合list中任取一个数据向量计算数据向量与其它向量之间的距离H;S303:如果当前不存在Canopy,则把数据向量作为一个Canopy,如果数据向量与某个Canopy距离在T1以内,则将数据向量加入到这个Canopy;如果数据向量曾经与某个Canopy的距离在T2以内,则需要把数据向量从list中删除,此时认为数据向量与这个Canopy已经足够接近,它不可以在做其他Canopy的中心。S304:重复执行步骤S302和S303,直至数据集合list为空,从而得到第一聚类,根据第一聚类计算K值。S4:根据K值使用K-Means算法对数据集合list进行聚类直到中心点收敛或达到预设要求,得到多个类簇。具体地,步骤S4进一步包括:S401:遍历数据集合list,将每个数据划分到最近的中心点中;计算每个聚类的平均值,并作为新的中心点,其中,每个点到中心点的距离公式为:其中,xi为当前数据向量第i个向量分量,ki为聚类中心点地i个分量;S402:判断每个中心点是否收敛或达到预设要求,如果每个中心点不收敛且未达到预设要求,返回步本文档来自技高网...
基于数据挖掘的安全检查标准库动态更新方法

【技术保护点】
一种基于数据挖掘的安全检查标准库动态更新方法,其特征在于,包括以下步骤:S1:从安全检查结果库提取出N种特征,将多种特征合成得到N维向量,其中,N为自然数;S2:对N维向量进行归一化处理得到数据集合;S3:使用canopy算法对所述数据集合进行聚合得到第一聚类,根据所述第一聚类的K值;S4:根据K值使用K‑Means算法对所述数据集合进行聚类直到中心点收敛或达到预设要求,得到多个类簇;S5:根据预设向量相似度阈值确定每个类簇中的关键元素,根据所述关键元素提炼出导致系统运行安全隐患的关键属性,当所述安全检查结果库中新检查项的所述关键属性的数量大于预设关键属性数量阈值时,将所述新检查项加入到所述安全检查标准库中。

【技术特征摘要】
1.一种基于数据挖掘的安全检查标准库动态更新方法,其特征在于,包括以下步骤:S1:从安全检查结果库提取出N种特征,将多种特征合成得到N维向量,其中,N为自然数;S2:对N维向量进行归一化处理得到数据集合;S3:使用canopy算法对所述数据集合进行聚合得到第一聚类,根据所述第一聚类的K值;S4:根据K值使用K-Means算法对所述数据集合进行聚类直到中心点收敛或达到预设要求,得到多个类簇;S5:根据预设向量相似度阈值确定每个类簇中的关键元素,根据所述关键元素提炼出导致系统运行安全隐患的关键属性,当所述安全检查结果库中新检查项的所述关键属性的数量大于预设关键属性数量阈值时,将所述新检查项加入到所述安全检查标准库中。2.根据权利要求1所述的基于数据挖掘的安全检查标准库动态更新方法,其特征在于,通过以下公式进行归一化处理:xi*=xi-ui∂i]]>其中,为归一化结果,ui为xi维度上的均值,为xi维度上的标准差。3.根据权利要求1所述的基于数据挖掘的安全检查标准库动态更新方法,其特征在于,步骤S3进一步包括:S301:设定距离阈值T1和第二距离T2,且距离阈值T1大于距离阈值T2;S302:从所述数据集合随机选定一个数据向量,计算所述选定数据向量与其它向量之间的距离H;S303...

【专利技术属性】
技术研发人员:李矛莫琦冯永青付龙明王立娜卢颖浩
申请(专利权)人:中国南方电网有限责任公司北京中恒博瑞数字电力科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1