System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据分析,特别是涉及一种埋点采集状态检测方法、装置、电子设备及存储介质。
技术介绍
1、随着互联网技术的蓬勃发展,互联网用户的数量不断增加,越来越多的企业已开始挖掘用户行为数据的商业价值,利用行为数据进行精准有效的数字营销。
2、目前,随着行为数据采集分析平台的深入使用,采集的埋点数据急剧增长,对埋点采集中的异常数据进行精准定位和预测告警显得尤为重要。
技术实现思路
1、本申请实施例所要解决的技术问题是提供一种埋点采集状态检测方法、装置、电子设备及存储介质,以精准定位埋点采集中的异常数据,有效提高准确获取异常数据的能力,提高采集数据的质量,为后续的数据分析提供保障。
2、第一方面,本申请实施例提供了一种埋点采集状态检测方法,所述方法包括:
3、基于预先构建的目标埋点的数据量阈值预测模型,预测得到所述目标埋点在未来时长内各时间段的采集数量阈值;
4、获取由所述目标埋点采集的所述各时间段的埋点采集数据的数据量;
5、基于所述数据量和所述采集数量阈值,确定所述目标埋点的埋点采集状态。
6、可选地,在所述基于预先构建的目标埋点的数据量阈值预测模型,预测得到所述目标埋点在未来时长内各时间段的采集数量阈值之前,还包括:
7、获取所述目标埋点在距离当前时间为预设时长内采集的埋点数据;
8、基于所述埋点数据对应的时间戳信息,对所述埋点数据进行排序,生成基于时间序列的埋点数据;
9、
10、可选地,所述基于所述埋点数据对应的时间戳信息,对所述埋点数据进行排序,生成基于时间序列的埋点数据,包括:
11、对所述埋点数据进行预处理,得到预处理埋点数据;
12、基于所述时间戳信息和预设时长信息,对所述预处理埋点数据进行排序,生成基于时间序列的埋点数据。
13、可选地,所述对所述埋点数据进行预处理,得到预处理埋点数据,包括:
14、对所述埋点数据进行数据清洗,得到清洗埋点数据;
15、在所述清洗埋点数据中存在缺失数据的情况下,基于所述时间戳信息对所述清洗埋点数据进行插值处理,得到补全埋点数据;
16、基于预设去噪算法对所述补全埋点数据进行去噪处理,得到所述预处理埋点数据。
17、可选地,所述基于预设算法对所述基于时间序列的埋点数据的数据量进行建模,得到所述数据量阈值预测模型,包括:
18、分析所述基于时间序列的埋点数据的数据量,得到所述目标埋点的埋点趋势项参数;
19、基于预设分析模型对所述基于时间序列的埋点数据进行处理,得到所述目标埋点的分析模型参与计算项参数;
20、基于预设周期对所述基于时间序列的埋点数据的数据量进行分析,得到所述目标埋点的周期项参数;
21、对所述基于时间序列的埋点数据的数据量中指定日期的数据量进行分析,得到指定日期项参数;
22、基于所述埋点趋势项参数、所述分析模型参与计算项参数、所述周期项参数、所述指定日期项参数和模型迭代过程中产生的误差项参数,构建得到所述数据量阈值预测模型。
23、可选地,所述基于所述数据量和所述采集数量阈值,确定所述目标埋点的埋点采集状态,包括:
24、在所述数据量大于或者等于所述采集数量阈值的情况下,确定所述目标埋点的埋点采集状态为异常状态;
25、在所述数据量小于所述采集数量阈值的情况下,确定所述目标埋点的埋点采集状态为正常状态。
26、可选地,在所述确定所述目标埋点的埋点采集状态为异常状态之后,还包括:
27、生成所述目标埋点对应的异常告警提示信息;
28、基于预设输出方式,输出所述异常告警提示信息。
29、第二方面,本申请实施例提供了一种埋点采集状态检测装置,所述装置包括:
30、采集数量阈值预测模块,用于基于预先构建的目标埋点的数据量阈值预测模型,预测得到所述目标埋点在未来时长内各时间段的采集数量阈值;
31、数据量获取模块,用于获取由所述目标埋点采集的所述各时间段的埋点采集数据的数据量;
32、埋点采集状态确定模块,用于基于所述数据量和所述采集数量阈值,确定所述目标埋点的埋点采集状态。
33、可选地,所述装置还包括:
34、埋点数据获取模块,用于获取所述目标埋点在距离当前时间为预设时长内采集的埋点数据;
35、埋点数据生成模块,用于基于所述埋点数据对应的时间戳信息,对所述埋点数据进行排序,生成基于时间序列的埋点数据;
36、预测模型获取模块,用于基于预设算法对所述基于时间序列的埋点数据的数据量进行建模,得到所述数据量阈值预测模型。
37、可选地,所述埋点数据生成模块包括:
38、预处理数据获取单元,用于对所述埋点数据进行预处理,得到预处理埋点数据;
39、埋点数据生成单元,用于基于所述时间戳信息和预设时长信息,对所述预处理埋点数据进行排序,生成基于时间序列的埋点数据。
40、可选地,所述预处理数据获取单元包括:
41、清洗数据获取子单元,用于对所述埋点数据进行数据清洗,得到清洗埋点数据;
42、补全数据获取子单元,用于在所述清洗埋点数据中存在缺失数据的情况下,基于所述时间戳信息对所述清洗埋点数据进行插值处理,得到补全埋点数据;
43、预处理数据获取子单元,用于基于预设去噪算法对所述补全埋点数据进行去噪处理,得到所述预处理埋点数据。
44、可选地,所述预测模型获取模块包括:
45、趋势项参数获取单元,用于分析所述基于时间序列的埋点数据的数据量,得到所述目标埋点的埋点趋势项参数;
46、计算项参数获取单元,用于基于预设分析模型对所述基于时间序列的埋点数据进行处理,得到所述目标埋点的分析模型参与计算项参数;
47、周期项参数获取单元,用于基于预设周期对所述基于时间序列的埋点数据的数据量进行分析,得到所述目标埋点的周期项参数;
48、日期项参数获取单元,用于对所述基于时间序列的埋点数据的数据量中指定日期的数据量进行分析,得到指定日期项参数;
49、预测模型构建单元,用于基于所述埋点趋势项参数、所述分析模型参与计算项参数、所述周期项参数、所述指定日期项参数和模型迭代过程中产生的误差项参数,构建得到所述数据量阈值预测模型。
50、可选地,所述埋点采集状态确定模块包括:
51、异常状态确定单元,用于在所述数据量大于或者等于所述采集数量阈值的情况下,确定所述目标埋点的埋点采集状态为异常状态;
52、正常状态确定单元,用于在所述数据量小于所述采集数量阈值的情况下,确定所述目标埋点的埋点采本文档来自技高网...
【技术保护点】
1.一种埋点采集状态检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述基于预先构建的目标埋点的数据量阈值预测模型,预测得到所述目标埋点在未来时长内各时间段的采集数量阈值之前,还包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述埋点数据对应的时间戳信息,对所述埋点数据进行排序,生成基于时间序列的埋点数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述对所述埋点数据进行预处理,得到预处理埋点数据,包括:
5.根据权利要求2所述的方法,其特征在于,所述基于预设算法对所述基于时间序列的埋点数据的数据量进行建模,得到所述数据量阈值预测模型,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述数据量和所述采集数量阈值,确定所述目标埋点的埋点采集状态,包括:
7.根据权利要求6所述的方法,其特征在于,在所述确定所述目标埋点的埋点采集状态为异常状态之后,还包括:
8.一种埋点采集状态检测装置,其特征在于,所述装置包括:
9.一种电子设备
10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1至7中任一项所述的埋点采集状态检测方法。
...【技术特征摘要】
1.一种埋点采集状态检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述基于预先构建的目标埋点的数据量阈值预测模型,预测得到所述目标埋点在未来时长内各时间段的采集数量阈值之前,还包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述埋点数据对应的时间戳信息,对所述埋点数据进行排序,生成基于时间序列的埋点数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述对所述埋点数据进行预处理,得到预处理埋点数据,包括:
5.根据权利要求2所述的方法,其特征在于,所述基于预设算法对所述基于时间序列的埋点数据...
【专利技术属性】
技术研发人员:张明哲,龚滨,仲籽彦,魏丫丫,陈梦南,聂延闯,洪迪,汪利伟,金伟德,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。