System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种电子数据安全管控系统技术方案_技高网

一种电子数据安全管控系统技术方案

技术编号:40072062 阅读:7 留言:0更新日期:2024-01-17 00:19
本发明专利技术涉及数据分析技术领域,具体涉及一种电子数据安全管控系统,包括:获取电力负荷数据的周期段;根据周期段获取周期段中的小段;根据周期段中的小段获取第一周期段、第二周期段以及目标周期段;根据第一周期段、第二周期段以及目标周期段使所有周期段内的小段数量相等;根据周期段中的小段获取周期段与其他所有周期段的相似程度;数据判断模块,用于根据周期段与其他所有周期段的相似程度获取若干类簇的周期段;根据若干类簇获取异常数据。本发明专利技术通过将相似性较高的周期分为一类,并从中选取数据构建子树。从而避免相似度不同的周期中的异常数据划分为一个样本集,导致异常结果检测不准确的情况发生。

【技术实现步骤摘要】

本专利技术涉及数据分析,具体涉及一种电子数据安全管控系统


技术介绍

1、随着社会的发展,科技水平的提高数字化的电子数据必然发挥着越来越重要的作用,而电力负荷数据作为一种常用的电子数据。由于其具有以天为单位的周期性特点,且每天的数据具有不同的相似性,若直接使用孤立森林检测对其进行异常数据检测,可能会使随机选取的样本集分布在相似的周期段,则会导致异常检测的结果不准确。

2、因此本专利技术提出了一种电子数据安全管控系统,该系统主要是实现对电力负荷数据中的异常数据进行精准的识别。首先通过将相似性较高的周期分为一类,并从中选取数据构建子树。从而避免相似度不同的周期中的异常数据划分为一个样本集,导致异常结果检测不准确的情况发生,达到精准识别电力负荷数据中的异常数据。


技术实现思路

1、本专利技术提供一种电子数据安全管控系统,以解决现有的问题:直接对电力负荷数据进行孤立森林检测,可能会导致异常检测的结果不准确。

2、本专利技术的一种电子数据安全管控系统采用如下技术方案:

3、包括以下模块:

4、数据采集模块,用于获取电力负荷数据的周期段;

5、数据处理模块,用于获取周期段中的小段;根据周期段中的小段获取第一周期段、第二周期段以及目标周期段;根据第一周期段、第二周期段以及目标周期段使所有周期段内的小段数量相等;

6、数据分析模块,用于获取周期段中的小段内的数据与其他任意周期段中的小段内的数据之间的相似程度;根据周期段中的小段内的数据与其他任意周期段中的小段内的数据之间的相似程度,获取周期段中的小段与其他所有周期段中的小段的相似程度;根据周期段中的小段内的数据数量与其他周期段中的小段内的数据数量的差异,获取周期段中每个小段的相似程度权重;根据周期段中每个小段的相似程度权重以及周期段中的小段与其他所有周期段中的小段的相似程度,获取周期段与其他所有周期段的相似程度;

7、数据判断模块,用于根据周期段与其他所有周期段的相似程度获取若干类簇、每个类簇中数据的数量以及所有类簇中数据的总数量;根据若干类簇、每个类簇中数据的数量以及所有类簇中数据的总数量获取异常周期段。

8、优选的,所述获取电力负荷数据的周期段,包括的具体方法为:

9、采集电力负荷数据,并以时间为横轴以电力负荷数据为纵轴,构建一个二维坐标系,将所有电力负荷数据置入二维坐标系中,再使用最小二乘法对二维坐标系中所有的电力负荷数据进行拟合,得到电力负荷数据曲线,以一天为一个周期单位对电力负荷数据曲线进行分段,得到若干电力负荷数据的周期段。

10、优选的,所述获取周期段中的小段;根据周期段中的小段获取第一周期段、第二周期段以及目标周期段,包括的具体方法为:

11、以所有电力负荷数据的周期段内所有极值点为分界点,将所有电力负荷数据的周期段分成若干个小段,统计每个电力负载数据周期段内小段数量,将所有电力负载数据周期段的小段数量构成小段数量的集合,将小段数量的集合中的众数作为目标段数,将小段数量小于目标段数的电力负载数据周期段记为第一周期段;将小段数量大于目标段数的电力负载数据周期段记为第二周期段;将小段数量等于目标段数的电力负载数据周期段记为目标周期段。

12、优选的,所述根据第一周期段、第二周期段以及目标周期段使所有周期段内的小段数量相等,包括的具体方法为:

13、对于第一周期段,计算第一周期段中分界点的数量与目标周期段中分界点的数量之间的差值记为,选取第一周期段中包含数据数量最多的小段记为第一特征小段,将位于第一特征小段中间的数据作为增加的第一个分界点,并重新将第一周期段分成若干个小段;得到增加一个分界点后的第一周期段内的小段;

14、选取增加一个分界点后的第一周期段中包含数据数量最多的小段记为第二特征小段,将位于第二特征小段中间的数据作为增加的第二个分界点,并重新将增加一个分界点后的第一周期段分成若干个小段;得到增加两个分界点后的第一周期段内的小段;

15、选取增加两个分界点后的第一周期段中包含数据数量最多的小段记为第三特征小段,将位于第三特征小段内中间的数据作为增加的第三个分界点,并重新将增加两个分界点后的第一周期段分成若干个小段;得到增加三个分界点后的第一周期段内的小段;

16、以此类推,直至增加的分界点数量与相等为止,得到增加若干分界点后的第一周期段内的小段;

17、对于第二周期段,计算第二周期段中分界点的数量与目标周期段中分界点的数量之间的差值记为;将第二周期段中第一个分界点与第三个分界点之间的数据记为第一大段,将第二周期段中第二个分界点与第四个分界点之间的数据记为第二大段,以此类推将第二周期段中第个分界点与第个分界点之间的数据记为第大段;直至,将第二周期段中倒数第三个分界点与倒数第一个分界点之间的数据记为最后大段;得到第二周期段中的所有大段;

18、选取第二周期段中包含数据数量最少的大段记为第一特征大段,将第一特征大段内的分界点作为去除的第一个分界点,得到去除一个分界点后的第二周期段;

19、将去除一个分界点后的第二周期段中第一个分界点与第三个分界点之间的数据记为第一大段,将去除一个分界点后的第二周期段中第二个分界点与第四个分界点之间的数据记为第二大段,以此类推将去除一个分界点后的第二周期段中第个分界点与第个分界点之间的数据记为第大段;直至,将去除一个分界点后的第二周期段中倒数第三个分界点与倒数第一个分界点之间的数据记为最后大段;得到去除一个分界点后的第二周期段中的所有大段;

20、选取去除一个分界点后的第二周期段中包含数据数量最少的大段记为第二特征大段,将第二特征大段内的分界点作为去除的第二个分界点,得到去除两个分界点后的第二周期段;

21、以此类推,直至去除的分界点数量与相等为止,得到去除若干分界点后的第二周期段,根据去除若干分界点后的第二周期段内的分界点,得到去除若干分界点后的第二周期段内的小段。

22、优选的,所述获取周期段中的小段内的数据与其他任意周期段中的小段内的数据之间的相似程度,包括的具体方法为:

23、将第个周期段第个小段与第个周期段第个小段中包含数据数量最多的小段作为第个周期段与第个周期段的第个基准小段,并统计第个基准小段内的数据数量;对第个周期段第个小段与第个周期段第个小段中的不是第个基准小段的其他小段进行末位补零处理,使其他小段内的数据数量等于第个基准小段的数据数量,将经过末位补零的其他小段记为第个非基准小段;最后通过基准小段与非基准小段,计算第个周期段中的第个小段内的数据与第个周期段中的第个小段内的数据之间的相似程度,其具体的计算公式为:

24、

25、式中,表示第个周期段中的第个小段内的数据与第个周期段中的第个小段内的数据之间的相似程度;表示第个周期段与第个周期段的第个基准小段中数据的数量;表示第个周期段与第个周期段的第个基准小段中的第个数据的值;表示第个周期段本文档来自技高网...

【技术保护点】

1.一种电子数据安全管控系统,其特征在于,该系统包括以下模块:

2.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述获取电力负荷数据的周期段,包括的具体方法为:

3.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述获取周期段中的小段;根据周期段中的小段获取第一周期段、第二周期段以及目标周期段,包括的具体方法为:

4.根据权利要求3所述一种电子数据安全管控系统,其特征在于,所述根据第一周期段、第二周期段以及目标周期段使所有周期段内的小段数量相等,包括的具体方法为:

5.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述获取周期段中的小段内的数据与其他任意周期段中的小段内的数据之间的相似程度,包括的具体方法为:

6.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述根据周期段中的小段内的数据与其他任意周期段中的小段内的数据之间的相似程度,获取周期段中的小段与其他所有周期段中的小段的相似程度,包括的具体计算公式为:

7.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述根据周期段中的小段内的数据数量与其他周期段中的小段内的数据数量的差异,获取周期段中每个小段的相似程度权重,包括的具体计算公式为:

8.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述根据周期段中每个小段的相似程度权重以及周期段中的小段与其他所有周期段中的小段的相似程度,获取周期段与其他所有周期段的相似程度,包括的具体计算公式为:

9.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述根据周期段与其他所有周期段的相似程度获取若干类簇、每个类簇中数据的数量以及所有类簇中数据的总数量,包括的具体方法为:

10.根据权利要求9所述一种电子数据安全管控系统,其特征在于,所述根据若干类簇、每个类簇中数据的数量以及所有类簇中数据的总数量获取异常周期段,包括的具体方法为:

...

【技术特征摘要】

1.一种电子数据安全管控系统,其特征在于,该系统包括以下模块:

2.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述获取电力负荷数据的周期段,包括的具体方法为:

3.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述获取周期段中的小段;根据周期段中的小段获取第一周期段、第二周期段以及目标周期段,包括的具体方法为:

4.根据权利要求3所述一种电子数据安全管控系统,其特征在于,所述根据第一周期段、第二周期段以及目标周期段使所有周期段内的小段数量相等,包括的具体方法为:

5.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述获取周期段中的小段内的数据与其他任意周期段中的小段内的数据之间的相似程度,包括的具体方法为:

6.根据权利要求1所述一种电子数据安全管控系统,其特征在于,所述根据周期段中的小段内的数据与其他任意周期段中的小段内的数据之间的相似程度,获取周期段中的...

【专利技术属性】
技术研发人员:柳晶李全德陈广辉杨丽芬薛海清
申请(专利权)人:钛合联深圳科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1