System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及移动通信,尤其涉及一种数据处理方法、装置及系统。
技术介绍
1、相关技术中,随着移动通信技术的不断进步,用于移动通信的终端设备数不断增加,通信的数据量也随之增加,而这些数据的数据量是不可控的,可能会在某一时间段出现数据量激增的情况,导致在用计算机设备对数据是否出现异常进行审核时,难以及时高效的完成审核。
技术实现思路
1、为克服相关技术中存在的问题,本公开提供一种数据处理方法、装置及系统。
2、根据本公开实施例的第一方面,提供一种数据处理方法,包括:
3、获取第一滑动时间窗口的第一窗口长度,以及异常时序数据图对应的第二窗口长度;所述异常时序数据图中包括幅度值大于或等于第一阈值的第一波峰;所述第一滑动时间窗口用于确定所述第一窗口长度内的数据;
4、根据所述第一窗口长度和所述第二窗口长度,确定第三窗口长度;
5、基于所述第三窗口长度确定所述第二滑动时间窗;所述第一滑动时间窗口为所述第二滑动时间窗口的上一个时间窗口;
6、获取待处理的时序数据,利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图;
7、确定所述第一时序数据图与所述异常时序数据图的相似度值;
8、根据所述相似度值确定所述多个数据中是否存在异常数据。
9、在本申请一些实施例中,在所述获取第一滑动时间窗口的第一窗口长度,以及异常时序数据图对应的第二窗口长度之前,所述方法还包括:
10、获取多
11、按照预设时间窗口长度,基于每个历史数据的第二处理时长信息和所述第二映射关系,将所述多个历史数据划分为多个数据集;
12、针对所述多个数据集中的每个数据集,基于所述数据集中历史数据的第二处理时长信息和第二映射关系,生成历史时序数据图;
13、从多个历史时序数据图中选取包括第一波峰的历史时序数据图,得到所述异常时序数据图;所述第一波峰对应的历史数据中包括异常数据。
14、在本申请一些实施例中,在所述获取待处理的时序数据,利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图历史时序数据图之前,所述方法还包括:
15、分别确定每个数据集中异常数据的占比值;
16、将占比值大于第二预设阈值的数据集从所述多个数据集中去除。
17、在本申请一些实施例中,所述根据所述第一窗口长度和所述第二窗口长度,确定第三窗口长度,包括:
18、根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值;
19、将所述权重值与所述第二窗口长度相乘,得到第一中间值;
20、将所述第一中间值和所述第一窗口长度相乘,得到所述第二滑动时间窗口对应的第三窗口长度。
21、在本申请一些实施例中,所述影响因子包括管控力度因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:
22、通过第一公式计算所述管控力度因子,并将所述管控力度因子确定为所述权重值;
23、其中,所述第一公式表示如下:
24、管控力度因子=basefactor+(1-basefactor)*ln(exponent*normalizedindex)
25、其中,basefactor为预设的基础因子,exponent为预设的指数因子,normalizedindex是第一指标值,normalizedindex是对所述多个数据各自的第一处理时长进行归一化处理得到的。
26、在本申请一些实施例中,所述影响因子包括时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:
27、通过第二公式计算所述时间因子,并将所述时间因子确定为所述权重值;
28、其中,所述第二公式表示如下:
29、时间因子=hourlydatarate+duration(weekdayfactor*weekdayindicator+weekendfactor*weekendindicator)
30、weekdayfactor=(act_weekday-avg_weekend)/avg_weekend
31、weekendfactor=(act_weekend-avg_weekday)/avg_weekday
32、hourlydatarate=(第一滑动时间窗口内的数据量-第二滑动时间窗口内的数据量)/第一滑动时间窗口内的数据量
33、其中,duration在所述第二滑动时间窗口中包括0点的情况下取值为1,在所述滑动窗口中不包括0点的情况下取值为0;weekdayindicator在所述第二滑动时间窗口的时间段属于工作日的情况下,取值为1,在所述第二滑动时间窗口的时间段属于休息日的情况下,取值为0;weekendindicator在所述第二滑动时间窗口的时间段属于工作日的情况下,取值为0,在所述第二滑动时间窗口的时间段属于休息日的情况下,取值为1;avg_weekday为工作日平均数据量;avg_weekend为休息日平均数据量;act_weekday为工作日实际数据量;act_weekend为休息日实际数据量,第二滑动时间窗口为第一滑动时间窗口的前一个时间窗口。
34、在本申请一些实施例中,所述影响因子包括管控力度因子和时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:
35、通过第一公式计算所述管控力度因子;
36、通过第二公式计算所述时间因子;
37、将所述管控力度因子和所述时间因子的乘积确定为所述第二窗口长度的权重值。
38、在本申请一些实施例中,在所述根据所述相似度值确定所述多个数据中是否存在异常数据之后,所述方法还包括:
39、在确定所述多个数据中存在异常数据的情况下,从所述多个数据中获取所述第一时序数据图中第二波峰对应的目标数据;其中,所述第二波峰的幅度值大于或者等于所述第一阈值。
40、在本申请一些实施例中,所述利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图第一时序数据图,包括:
41、从所述时序数据中获取所述多个数据;
42、获取所述多个数据中每个数据的第一处理时长信息,以及第一处理时长与时间的第一映射关系;
43、基于所述第一处理时长信息和所述第一映射关系,生成第一时序数据图。
44、在本申请一些实施例中,所述利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图,包括:
45、获取所述时序数据中每个数据的第一处理时长信息,以及第一处理时长与时间的第一映本文档来自技高网...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的数据处理方法,其特征在于,在所述获取第一滑动时间窗口的第一窗口长度,以及异常时序数据图对应的第二窗口长度之前,所述方法还包括:
3.根据权利要求2所述的数据处理方法,其特征在于,在所述获取待处理的时序数据,利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图历史时序数据图之前,所述方法还包括:
4.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述第一窗口长度和所述第二窗口长度,确定第三窗口长度,包括:
5.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括管控力度因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:
6.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:
7.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括管控力度因子和时间因子;所述根据所
8.根据权利要求1所述的数据处理方法,其特征在于,在所述根据所述相似度值确定所述多个数据中是否存在异常数据之后,所述方法还包括:
9.根据权利要求8所述的数据处理方法,其特征在于,所述利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图第一时序数据图,包括:
10.根据权利要求8所述的数据处理方法,其特征在于,所述利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图,包括:
11.根据权利要求9所述的数据处理方法,其特征在于,所述基于所述第一处理时长信息和所述第一映射关系,生成第一时序数据图,包括:
12.根据权利要求11所述的数据处理方法,其特征在于,所述从所述多个数据中获取所述第一时序数据图中第二波峰对应的目标数据,包括:
13.一种数据处理装置,其特征在于,包括:
14.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至12中任一项所述的方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的方法。
16.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1至12中任一项所述的方法。
...【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的数据处理方法,其特征在于,在所述获取第一滑动时间窗口的第一窗口长度,以及异常时序数据图对应的第二窗口长度之前,所述方法还包括:
3.根据权利要求2所述的数据处理方法,其特征在于,在所述获取待处理的时序数据,利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图历史时序数据图之前,所述方法还包括:
4.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述第一窗口长度和所述第二窗口长度,确定第三窗口长度,包括:
5.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括管控力度因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:
6.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:
7.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括管控力度因子和时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:
8.根据权利要求1所述的数据处理方法,其特征在于,在所述根据所述相似度值确定所述多个数据中是...
【专利技术属性】
技术研发人员:彭彦宇,庄仁峰,胡文辉,郑敏,吴华挚,苏儒,李盛阁,郝立波,张家晟,杜琪,刘特玮,马德琳,戴晶晶,曹永超,贺思航,李陈财,胡斯轶,唐来贤,陈赞旺,林晓生,曾凌枫,黄德深,张俊朋,
申请(专利权)人:中移互联网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。