一种数据检测方法及装置制造方法及图纸

技术编号:21059736 阅读:29 留言:0更新日期:2019-05-08 06:42
本申请公开一种数据检测方法及装置,该方法包括:首先确定待检测报表,然后,获取为所述待检测报表设置的数据检测范围,并获取为所述数据检测范围设置的检测指标,这样便可以根据所述检测指标对应的检测规则,检测所述数据检测范围内的数据,若所述数据检测范围内的数据符合所述检测指标对应的异常判定条件,即可以确定所述数据检测范围内存在异常数据,从而可以输出异常检测结果。可见,本申请可以实现自动数据检测,不但降低了人力成本,还能够及时、准确地发现异常数据。

【技术实现步骤摘要】
一种数据检测方法及装置
本申请涉及数据处理
,尤其涉及一种数据检测方法及装置。
技术介绍
报表导出即为将系统生成的报表数据导出为excel表格或其它形式的文件。但是,用户一般只关心报表数据是否能够成功导出,对于导出的报表数据的准确性把控和关注度还不够。目前,当导出报表数据后,只是由人工对报表数据做一个判断,即判断报表数据是否异常,但是,这种人工判断方式不但耗费较多的人力,还无法及时、准确地发现异常数据。
技术实现思路
鉴于上述问题,本申请提供了一种数据检测方法及装置,能够及时、准确地发现异常数据。本申请提供了一种数据检测方法,所述方法包括:确定待检测报表;获取为所述待检测报表设置的数据检测范围;获取为所述数据检测范围设置的检测指标,并确定与所述检测指标所对应的检测规则和异常判定条件;根据所述检测指标对应的检测规则,检测所述数据检测范围内的数据;若所述数据检测范围内的数据符合所述检测指标对应的异常判定条件,则确定所述数据检测范围内存在异常数据,并输出异常检测结果。可选的,所述获取为所述数据检测范围设置的检测指标,包括:获取用户为所述数据检测范围设置的检测指标。可选的,当所述数据检测范围包括至少一个表项的表项数据时,所述检测指标包括每一表项对应的指标集合,所述指标集合包括最大阈值、最小阈值、平均值范围、以及数据占比阈值中的一个或多个指标项;则,所述根据所述检测指标对应的检测规则,检测所述数据检测范围内的数据,包括:若所述指标集合包括所述最大阈值,则检测对应表项数据中是否存在大于所述最大阈值的数据;若所述指标集合包括所述最小阈值,则检测对应表项数据中是否存在小于所述最小阈值的数据;若所述指标集合包括所述平均值范围,则计算对应表项数据的平均值,并检测所述平均值是否未在所述平均值范围内;若所述指标集合包括所述数据占比阈值,则计算对应表项数据中处于所述最大阈值与所述最小阈值之间的数据量,计算所述数据量在对应表项数据中的占比,并检测所述占比是否低于所述数据占比阈值;相应地,所述若所述数据检测范围内的数据符合所述检测指标对应的异常判定条件,则确定所述数据检测范围内存在异常数据,包括:若存在检测结果为是的表项数据,则确定所述数据检测范围内存在异常表项数据,输出所述异常表项数据的异常检测结果。可选的,所述获取为所述数据检测范围设置的检测指标,包括:获取至少一份目标样本报表,所述目标样本报表为正常报表、且所述目标样本报表中存在所述数据检测范围内的每一表项;利用所述至少一份目标样本报表为所述数据检测范围设置检测指标。可选的,所述方法还包括:建立样本报表库,所述样本报表库包括至少一份样本报表;则,所述获取至少一份目标样本报表,包括:判断所述样本报表库中的目标样本报表是否达到第一预设数量;若是,则从所述样本报表库中选取所述第一预设数量的目标样本报表;若否,则从所述样本报表库中选取所有目标样本报表。可选的,所述利用所述至少一份目标样本报表为所述数据检测范围设置检测指标,包括:当所述数据检测范围包括至少一个表项的表项数据时,为所述数据检测范围设置检测指标,所述检测指标包括每一表项对应的指标集合,所述指标集合包括每一目标样本报表关于对应表项的最大阈值、最小阈值、平均值范围、以及样本数据范围中的一个或多个指标项;其中,所述最大阈值为对应表项的样本数据中的最大值,所述最小阈值为对应表项的样本数据中的最小值,所述平均值范围为包括对应表项的样本数据的平均值在内的数值范围,所述样本数据范围为所述最大值与所述最小值之间的数值范围,所述样本数据为所述对应表项的全部或部分数据。可选的,所述根据所述检测指标对应的检测规则,检测所述数据检测范围内的数据,包括:对于所述数据检测范围内的每一表项,若对应表项的指标集合包括每一目标样本报表对应的最大阈值,则检测对应表项数据中是否存在大于第二预设数量的最大阈值的数据;若对应表项的指标集合包括每一目标样本报表对应的最小阈值,则检测对应表项数据中是否存在小于第三预设数量的最小阈值的数据;若对应表项的指标集合包括每一目标样本报表对应的平均值范围,则计算对应表项数据的平均值,并检测所述平均值是否未在第四预设数量的平均值范围内;若对应表项的指标集合包括每一目标样本报表对应的样本数据范围,则计算对应表项数据所在的数据范围,并检测所述数据范围是否在第五预设数量的样本数据范围内;其中,所述第二预设数量、所述第三预设数量、所述第四预设数量、所述第五预设数量均小于所述目标样本报表的总数量;相应地,所述若所述数据检测范围内的数据符合所述检测指标对应的异常判定条件,则确定所述数据检测范围内存在异常数据,包括:若存在检测结果为否的表项数据,则确定所述数据检测范围内存在异常表项数据,输出所述异常表项数据的异常检测结果。本申请还提供了一种一种数据检测装置,所述装置包括:待检报表确定单元,用于确定待检测报表;检测范围获取单元,用于获取为所述待检测报表设置的数据检测范围;检测指标获取单元,用于获取为所述数据检测范围设置的检测指标,并确定与所述检测指标所对应的检测规则和异常判定条件;异常数据检测单元,用于根据所述检测指标对应的检测规则,检测所述数据检测范围内的数据;检测结果输出单元,用于若所述数据检测范围内的数据符合所述检测指标对应的异常判定条件,则确定所述数据检测范围内存在异常数据,并输出异常检测结果。本申请还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述任一项所述的方法。本申请还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任一项所述的方法。借由上述技术方案,本申请提供的一种数据检测方法及装置中,首先确定待检测报表,然后,获取为所述待检测报表设置的数据检测范围,并获取为所述数据检测范围设置的检测指标,这样便可以根据所述检测指标对应的检测规则,检测所述数据检测范围内的数据,若所述数据检测范围内的数据符合所述检测指标对应的异常判定条件,即可以确定所述数据检测范围内存在异常数据,从而可以输出异常检测结果。可见,本申请可以实现自动数据检测,不但降低了人力成本,还能够及时、准确地发现异常数据。上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本申请实施例提供的数据检测方法的流程示意图之一;图2示出了本申请实施例提供的数据检测方法的流程示意图之二;图3示出了本申请实施例提供的广告报表示意图;图4示出了本申请实施例提供的数据检测方法的流程示意图之三;图5示出了本申请实施例提供的数据检测装置的组成示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够本文档来自技高网...

【技术保护点】
1.一种数据检测方法,其特征在于,所述方法包括:确定待检测报表;获取为所述待检测报表设置的数据检测范围;获取为所述数据检测范围设置的检测指标,并确定与所述检测指标所对应的检测规则和异常判定条件;根据所述检测指标对应的检测规则,检测所述数据检测范围内的数据;若所述数据检测范围内的数据符合所述检测指标对应的异常判定条件,则确定所述数据检测范围内存在异常数据,并输出异常检测结果。

【技术特征摘要】
1.一种数据检测方法,其特征在于,所述方法包括:确定待检测报表;获取为所述待检测报表设置的数据检测范围;获取为所述数据检测范围设置的检测指标,并确定与所述检测指标所对应的检测规则和异常判定条件;根据所述检测指标对应的检测规则,检测所述数据检测范围内的数据;若所述数据检测范围内的数据符合所述检测指标对应的异常判定条件,则确定所述数据检测范围内存在异常数据,并输出异常检测结果。2.根据权利要求1所述的方法,其特征在于,所述获取为所述数据检测范围设置的检测指标,包括:获取用户为所述数据检测范围设置的检测指标。3.根据权利要求1或2所述的方法,其特征在于,当所述数据检测范围包括至少一个表项的表项数据时,所述检测指标包括每一表项对应的指标集合,所述指标集合包括最大阈值、最小阈值、平均值范围、以及数据占比阈值中的一个或多个指标项;则,所述根据所述检测指标对应的检测规则,检测所述数据检测范围内的数据,包括:若所述指标集合包括所述最大阈值,则检测对应表项数据中是否存在大于所述最大阈值的数据;若所述指标集合包括所述最小阈值,则检测对应表项数据中是否存在小于所述最小阈值的数据;若所述指标集合包括所述平均值范围,则计算对应表项数据的平均值,并检测所述平均值是否未在所述平均值范围内;若所述指标集合包括所述数据占比阈值,则计算对应表项数据中处于所述最大阈值与所述最小阈值之间的数据量,计算所述数据量在对应表项数据中的占比,并检测所述占比是否低于所述数据占比阈值;相应地,所述若所述数据检测范围内的数据符合所述检测指标对应的异常判定条件,则确定所述数据检测范围内存在异常数据,包括:若存在检测结果为是的表项数据,则确定所述数据检测范围内存在异常表项数据,输出所述异常表项数据的异常检测结果。4.根据权利要求1所述的方法,其特征在于,所述获取为所述数据检测范围设置的检测指标,包括:获取至少一份目标样本报表,所述目标样本报表为正常报表、且所述目标样本报表中存在所述数据检测范围内的每一表项;利用所述至少一份目标样本报表为所述数据检测范围设置检测指标。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:建立样本报表库,所述样本报表库包括至少一份样本报表;则,所述获取至少一份目标样本报表,包括:判断所述样本报表库中的目标样本报表是否达到第一预设数量;若是,则从所述样本报表库中选取所述第一预设数量的目标样本报表;若否,则从所述样本报表库中选取所有目标样本报表。6.根据权利要求4或5所述的方法,其特征在于,所述利用所述至少一份目标样本报表为所述数据检测范围设置检测指标,包括:当所述数据检测范围包括至少一个表项的表...

【专利技术属性】
技术研发人员:李尚声
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1