【技术实现步骤摘要】
一种数据筛选方法、装置、电子设备及存储介质
[0001]本专利技术涉及数据处理
,更具体的说,涉及一种数据筛选方法、装置、电子设备及存储介质。
技术介绍
[0002]目前,很多场景下需要对监控服务器采集的指标数据进行多维度的集中分析。但是,在指标数据的实时采集过程中,特别是监控服务器整体数量较多时,往往会有部分监控服务器,因系统环境异常等原因,造成采集到的指标数据和真实数据存在较大差异。当这些异常数据应用到多维度的集中分析时,会使分析结果有较大误差,从而影响后续的分析决策。
技术实现思路
[0003]有鉴于此,本专利技术公开一种数据筛选方法、装置、电子设备及存储介质,以实现通过指标数据取值范围边界和异常检测策略,从原始指标数据中筛选出异常数据并剔除,达到了还原真实数据的目的,从而可以将对目标指标数据的多维度集中分析结果,精准的应用到后续的分析决策中。
[0004]一种数据筛选方法,包括:
[0005]接收用户侧发送的数据查询请求;
[0006]从外部数据库获取与所述数据查询请求对 ...
【技术保护点】
【技术特征摘要】
1.一种数据筛选方法,其特征在于,包括:接收用户侧发送的数据查询请求;从外部数据库获取与所述数据查询请求对应的原始指标数据;从所述原始指标数据中剔除指标数据取值范围边界外的异常数据,得到中间指标数据;基于异常检测策略,从所述中间指标数据中剔除异常数据,得到目标指标数据,其中,所述异常检测策略能够筛选出局部离群因子。2.根据权利要求1所述的数据筛选方法,其特征在于,所述从外部数据库获取与所述数据查询请求对应的原始指标数据,包括:解析所述数据查询请求,得到待查询数据内容;将所述待查询数据内容转换为相应的查询语句;将所述查询语句发送至所述外部数据库,并获取所述外部数据库返回的所述原始指标数据。3.根据权利要求1所述的数据筛选方法,其特征在于,所述基于异常检测策略,从所述中间指标数据中剔除异常数据,得到目标指标数据,包括:对所述中间指标数据中每个指标对应的每个指标数据,按照局部离群因子计算策略,分别计算得到每个所述指标数据对应的局部离群因子;将每个所述局部离群因子与对应指标预定义的离群因子阈值进行大小比较;将大于所述离群因子阈值的所述局部离群因子对应的指标数据确定为异常数据进行剔除;将不大于所述离群因子阈值的所述局部离群因子对应的指标数据确定为所述目标指标数据。4.根据权利要求3所述的数据筛选方法,其特征在于,所述对所述中间指标数据中的每个指标对应的每个指标数据,按照局部离群因子计算策略,分别计算得到每个所述指标数据对应的局部离群因子,包括:将所述中间指标数据中的每个指标对应的每个指标数据作为一个数据点,并计算所述数据点的局部可达密度以及所述数据点的邻域点的局部可达密度;计算所述数据点的邻域点的局部可达密度与所述数据点的局部可达密度之比的平均数,并将所述平均数确定为所述局部离群因子。5.根据权利要求4所述的数据筛选方法,其特征在于,所述计算所述数据点的邻域点的局部可达密度与所述数据点的局部可达密度之比的平均数的表达式如下:式中,LOF
k
(p)为局部离群因子,表示数据点p的邻域点N
k
【专利技术属性】
技术研发人员:李勤,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。