The invention relates to large data technology, and provides a data quality detection method, device and computer readable storage medium. The method includes: obtaining at least one data to be detected from the data source, in which each data to be detected includes content data and metadata; matching at least one detection rule for each data to be detected in the pre-established detection rule base according to the preset matching rule; and detecting the data to be detected by using matching detection rule to obtain data quality detection. Result. By using the invention, the automation of data quality detection can be realized, the efficiency of data quality detection can be improved, and the labor and time cost can be reduced.
【技术实现步骤摘要】
数据质量检测方法、装置及存储介质
本专利技术涉及数据处理
,尤其涉及一种数据质量检测方法、装置及计算机可读存储介质。
技术介绍
随着信息技术的发展和大数据时代的到来,数据信息朝着海量、多样化的方向发展,数据质量日益受到各企业以及政府部门的重视。其中,如何对数据质量进行灵活、准确、高效的检测是一个非常值得关注的研究方向。目前,对于数据质量的检测,通常需要测试人员根据业务逻辑,对每个字段构造全面的测试用例,即由测试人员编写测试用例的代码和执行逻辑,并由测试人员判断执行结果中是否存在异常、是否满足业务需求。如果测试完成后涉及到对异常数据的修复,还需要在数据修复后再次人工测试回归,反复编写和执行测试用例。因为这种方式是人为参与,测试用例的覆盖率有限,所以对异常数据存在漏检的可能,由于对不同的字段以及修复后的数据需要重复执行测试用例,检测效率也难以得到保证。
技术实现思路
鉴于以上原因,有必要提供一种数据质量检测方法、装置及计算机可读存储介质,实现自动化的数据质量检测,提高数据质量检测的效率和通用性,减少人为因素对数据质量检测结果造成的影响。为实现上述目的,本专利技术提供一种数据质量检测方法,应用于电子装置,该方法包括:获取步骤:从数据源中获取至少一条待检测数据,其中,每条待检测数据包括内容数据和元数据;匹配步骤:根据预设的匹配规则在预先建立的检测规则库中为所述每条待检测数据匹配至少一条检测规则;及检测步骤:利用匹配的检测规则对所述待检测数据进行检测,得到数据质量检测结果。优选地,所述元数据包括该条待检测数据的重要程度、默认值、时间戳、所属字段以及该字段的数据类型 ...
【技术保护点】
1.一种数据质量检测方法,应用于电子装置,其特征在于,该方法包括:获取步骤:从数据源中获取至少一条待检测数据,其中,每条待检测数据包括内容数据和元数据;匹配步骤:根据预设的匹配规则在预先建立的检测规则库中为所述每条待检测数据匹配至少一条检测规则;及检测步骤:利用匹配的检测规则对所述待检测数据进行检测,得到数据质量检测结果。
【技术特征摘要】
1.一种数据质量检测方法,应用于电子装置,其特征在于,该方法包括:获取步骤:从数据源中获取至少一条待检测数据,其中,每条待检测数据包括内容数据和元数据;匹配步骤:根据预设的匹配规则在预先建立的检测规则库中为所述每条待检测数据匹配至少一条检测规则;及检测步骤:利用匹配的检测规则对所述待检测数据进行检测,得到数据质量检测结果。2.如权利要求1所述的数据质量检测方法,其特征在于,所述元数据包括该条待检测数据的重要程度、默认值、时间戳、所属字段以及该字段的数据类型中的一种或多种。3.如权利要求2所述的数据质量检测方法,其特征在于,该方法还包括:将属于同一字段的待检测数据归为一个待检测数据组,为每个待检测数据组中的待检测数据统一匹配检测规则。4.如权利要求1所述的数据质量检测方法,其特征在于,所述检测规则为基于MapReduce的并行化检测规则,每个检测规则包括规则名称、规则描述和预期结果。5.如权利要求1所述的数据质量检测方法,其特征在于,所述检测步骤还包括:若所述数据质量检测结果为异常且数据异常率大于预设告警阈值,则以预设方式对异常问题发出警示。6.一种电子装置,包括存储器和处理器,其特征在于,所述存储...
【专利技术属性】
技术研发人员:袁泉,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。