System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据处理方法、装置及系统制造方法及图纸_技高网

数据处理方法、装置及系统制造方法及图纸

技术编号:41340945 阅读:12 留言:0更新日期:2024-05-20 09:58
本公开是关于一种数据处理方法、装置及系统,涉及移动通信技术领域。其中,方法应用于数据处理设备,包括:获取第一滑动时间窗口的第一窗口长度,以及异常时序数据图对应的第二窗口长度,根据第一窗口长度和第二窗口长度,确定第三窗口长度,基于第三窗口长度确定第二滑动时间窗口,获取第二滑动时间窗口内的多个数据,利用多个数据生成第一时序数据图;确定第一时序数据图与异常时序数据图的相似度值,根据相似度值确定多个数据中是否存在异常数据。本方案提高了在数据量激增的情况下审核数据的效率。

【技术实现步骤摘要】

本公开涉及移动通信,尤其涉及一种数据处理方法、装置及系统


技术介绍

1、相关技术中,随着移动通信技术的不断进步,用于移动通信的终端设备数不断增加,通信的数据量也随之增加,而这些数据的数据量是不可控的,可能会在某一时间段出现数据量激增的情况,导致在用计算机设备对数据是否出现异常进行审核时,难以及时高效的完成审核。


技术实现思路

1、为克服相关技术中存在的问题,本公开提供一种数据处理方法、装置及系统。

2、根据本公开实施例的第一方面,提供一种数据处理方法,包括:

3、获取第一滑动时间窗口的第一窗口长度,以及异常时序数据图对应的第二窗口长度;所述异常时序数据图中包括幅度值大于或等于第一阈值的第一波峰;所述第一滑动时间窗口用于确定所述第一窗口长度内的数据;

4、根据所述第一窗口长度和所述第二窗口长度,确定第三窗口长度;

5、基于所述第三窗口长度确定所述第二滑动时间窗;所述第一滑动时间窗口为所述第二滑动时间窗口的上一个时间窗口;

6、获取待处理的时序数据,利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图;

7、确定所述第一时序数据图与所述异常时序数据图的相似度值;

8、根据所述相似度值确定所述多个数据中是否存在异常数据。

9、在本申请一些实施例中,在所述获取第一滑动时间窗口的第一窗口长度,以及异常时序数据图对应的第二窗口长度之前,所述方法还包括:

10、获取多个历史数据和每个历史数据的第二处理时长信息,以及第二处理时长与时间的第二映射关系;

11、按照预设时间窗口长度,基于每个历史数据的第二处理时长信息和所述第二映射关系,将所述多个历史数据划分为多个数据集;

12、针对所述多个数据集中的每个数据集,基于所述数据集中历史数据的第二处理时长信息和第二映射关系,生成历史时序数据图;

13、从多个历史时序数据图中选取包括第一波峰的历史时序数据图,得到所述异常时序数据图;所述第一波峰对应的历史数据中包括异常数据。

14、在本申请一些实施例中,在所述获取待处理的时序数据,利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图历史时序数据图之前,所述方法还包括:

15、分别确定每个数据集中异常数据的占比值;

16、将占比值大于第二预设阈值的数据集从所述多个数据集中去除。

17、在本申请一些实施例中,所述根据所述第一窗口长度和所述第二窗口长度,确定第三窗口长度,包括:

18、根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值;

19、将所述权重值与所述第二窗口长度相乘,得到第一中间值;

20、将所述第一中间值和所述第一窗口长度相乘,得到所述第二滑动时间窗口对应的第三窗口长度。

21、在本申请一些实施例中,所述影响因子包括管控力度因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:

22、通过第一公式计算所述管控力度因子,并将所述管控力度因子确定为所述权重值;

23、其中,所述第一公式表示如下:

24、管控力度因子=basefactor+(1-basefactor)*ln(exponent*normalizedindex)

25、其中,basefactor为预设的基础因子,exponent为预设的指数因子,normalizedindex是第一指标值,normalizedindex是对所述多个数据各自的第一处理时长进行归一化处理得到的。

26、在本申请一些实施例中,所述影响因子包括时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:

27、通过第二公式计算所述时间因子,并将所述时间因子确定为所述权重值;

28、其中,所述第二公式表示如下:

29、时间因子=hourlydatarate+duration(weekdayfactor*weekdayindicator+weekendfactor*weekendindicator)

30、weekdayfactor=(act_weekday-avg_weekend)/avg_weekend

31、weekendfactor=(act_weekend-avg_weekday)/avg_weekday

32、hourlydatarate=(第一滑动时间窗口内的数据量-第二滑动时间窗口内的数据量)/第一滑动时间窗口内的数据量

33、其中,duration在所述第二滑动时间窗口中包括0点的情况下取值为1,在所述滑动窗口中不包括0点的情况下取值为0;weekdayindicator在所述第二滑动时间窗口的时间段属于工作日的情况下,取值为1,在所述第二滑动时间窗口的时间段属于休息日的情况下,取值为0;weekendindicator在所述第二滑动时间窗口的时间段属于工作日的情况下,取值为0,在所述第二滑动时间窗口的时间段属于休息日的情况下,取值为1;avg_weekday为工作日平均数据量;avg_weekend为休息日平均数据量;act_weekday为工作日实际数据量;act_weekend为休息日实际数据量,第二滑动时间窗口为第一滑动时间窗口的前一个时间窗口。

34、在本申请一些实施例中,所述影响因子包括管控力度因子和时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:

35、通过第一公式计算所述管控力度因子;

36、通过第二公式计算所述时间因子;

37、将所述管控力度因子和所述时间因子的乘积确定为所述第二窗口长度的权重值。

38、在本申请一些实施例中,在所述根据所述相似度值确定所述多个数据中是否存在异常数据之后,所述方法还包括:

39、在确定所述多个数据中存在异常数据的情况下,从所述多个数据中获取所述第一时序数据图中第二波峰对应的目标数据;其中,所述第二波峰的幅度值大于或者等于所述第一阈值。

40、在本申请一些实施例中,所述利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图第一时序数据图,包括:

41、从所述时序数据中获取所述多个数据;

42、获取所述多个数据中每个数据的第一处理时长信息,以及第一处理时长与时间的第一映射关系;

43、基于所述第一处理时长信息和所述第一映射关系,生成第一时序数据图。

44、在本申请一些实施例中,所述利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图,包括:

45、获取所述时序数据中每个数据的第一处理时长信息,以及第一处理时长与时间的第一映本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的数据处理方法,其特征在于,在所述获取第一滑动时间窗口的第一窗口长度,以及异常时序数据图对应的第二窗口长度之前,所述方法还包括:

3.根据权利要求2所述的数据处理方法,其特征在于,在所述获取待处理的时序数据,利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图历史时序数据图之前,所述方法还包括:

4.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述第一窗口长度和所述第二窗口长度,确定第三窗口长度,包括:

5.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括管控力度因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:

6.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:

7.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括管控力度因子和时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:

8.根据权利要求1所述的数据处理方法,其特征在于,在所述根据所述相似度值确定所述多个数据中是否存在异常数据之后,所述方法还包括:

9.根据权利要求8所述的数据处理方法,其特征在于,所述利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图第一时序数据图,包括:

10.根据权利要求8所述的数据处理方法,其特征在于,所述利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图,包括:

11.根据权利要求9所述的数据处理方法,其特征在于,所述基于所述第一处理时长信息和所述第一映射关系,生成第一时序数据图,包括:

12.根据权利要求11所述的数据处理方法,其特征在于,所述从所述多个数据中获取所述第一时序数据图中第二波峰对应的目标数据,包括:

13.一种数据处理装置,其特征在于,包括:

14.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至12中任一项所述的方法。

15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的方法。

16.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1至12中任一项所述的方法。

...

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的数据处理方法,其特征在于,在所述获取第一滑动时间窗口的第一窗口长度,以及异常时序数据图对应的第二窗口长度之前,所述方法还包括:

3.根据权利要求2所述的数据处理方法,其特征在于,在所述获取待处理的时序数据,利用所述时序数据中与所述第二滑动时间窗口对应的多个数据生成第一时序数据图历史时序数据图之前,所述方法还包括:

4.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述第一窗口长度和所述第二窗口长度,确定第三窗口长度,包括:

5.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括管控力度因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:

6.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:

7.根据权利要求4所述的数据处理方法,其特征在于,所述影响因子包括管控力度因子和时间因子;所述根据所述第二滑动时间窗口对应的影响因子,确定所述第二窗口长度的权重值,包括:

8.根据权利要求1所述的数据处理方法,其特征在于,在所述根据所述相似度值确定所述多个数据中是...

【专利技术属性】
技术研发人员:彭彦宇庄仁峰胡文辉郑敏吴华挚苏儒李盛阁郝立波张家晟杜琪刘特玮马德琳戴晶晶曹永超贺思航李陈财胡斯轶唐来贤陈赞旺林晓生曾凌枫黄德深张俊朋
申请(专利权)人:中移互联网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1