【技术实现步骤摘要】
一种数据稽核方法、装置、电子设备及存储介质
[0001]本专利技术涉及计算机信息管理领域,尤其涉及一种数据稽核方法、装置、设备及存储介质。
技术介绍
[0002]随着科学技术的不断发展,数据仓库中存在大量的数据表,并且数据种类繁多,在数据集成的过程中,会存在大量从生产系统采集实时数据还原同步到数据仓库的场景,因此需要基于数据仓库数据进行实时质量剖析,让用户快速对数据进行画像,了解数据的概况,以便指导接下来的实时、批量数据处理运营工作。
[0003]在现有技术中,需要获取全部业务数据,并采用预设的稽核规则对数据进行处理,最后当业务数据稽核完成后,输出异常业务数据,并存储异常业务数据。
[0004]可见,现有技术中存在对数据稽核效率较低的问题。
技术实现思路
[0005]本专利技术实施例提供了一种数据稽核方法、装置、电子设备及存储介质,以解决现有技术中对数据稽核效率较低的问题。
[0006]第一方面,本专利技术实施例提供了一种数据稽核方法,包括:
[0007]获取目标数据库在实时数 ...
【技术保护点】
【技术特征摘要】
1.一种数据稽核方法,其特征在于,包括:获取目标数据库在实时数据同步流程中的第一数据信息;对所述第一数据信息按照数据维度进行分层抽样,以得到第一稽核数据组,所述数据维度包括如下其中一项:时间维度、标识维度和区域维度,所述第一稽核数据组包括N组稽核数据,N为正整数,所述分层抽样用于将所述第一数据信息划分为对应所述数据维度的若干个层级,并对每一个层级中的数据进行抽样;将所述第一稽核数据组与所述目标数据库中匹配所述第一稽核数据组的数据进行一致性判定,以得到第一指标分数;依据所述第一指标分数生成数据稽核结果,所述数据稽核结果用于表示所述第一数据信息中异常数据的存在状态。2.根据权利要求1所述的数据稽核方法,其特征在于,所述对所述第一数据信息按照数据维度进行分层抽样,以得到第一稽核数据组,包括:获取抽样总数量,所述抽样总数量小于所述第一数据信息的数量;将所述第一数据信息按照所述数据维度生成N组待稽核数据,每一组待稽核数据中至少包括一个数据;依据所述抽样总数量和每一组待稽核数据的数量生成对应每一组待稽核数据的抽样数量;将所述N组待稽核数据按照匹配的抽样数量进行数据抽取,以得到所述第一稽核数据组。3.根据权利要求2所述的数据稽核方法,其特征在于,所述抽样数量按照如下规则得到:将所述第一数据信息的总数量分别乘以N个目标比值得到所述抽样数量;其中,所述N个目标比值表示所述N组待稽核数据的数量分别除以所述第一稽核数据组的数量。4.根据权利要求1所述的数据稽核方法,其特征在于,所述将所述第一稽核数据组与所述目标数据库中匹配所述第一稽核数据组的数据进行一致性判定,以得到第一指标分数,包括:提取所述目标数据库中的第一目标数据,所述第一目标数据为所述目标数据库中与第二目标数据匹配的数据,所述第二目标数据为所述第一稽核数据组中的任意数据;对所述第一目标数据与所述第二目标数据进行一致性判定,且在所述第一目标数据与所述第二目标数据满足第一预设条件的情况下,将所述第二目标数据设定为满足一致性要求的数据;依据所述第二目标数据和所述第一稽核数据组生成所述第一指标分数,所述第一指标分数由所述第二目标数据的数据量除以第一稽核数据组的数据量得到;其中,所述第一预设条件表示所述第一目标数据中存在与所述第二目标数据一致的数据。5.根据权利要求1所述的数据稽核方法,其特征在于,所述数据稽核结果包括第一数据稽核结果或第二数据稽核结果;所述依据所述第一指标分数生成数据稽核结果,包括:
...
【专利技术属性】
技术研发人员:张子浪,刘海滨,李小言,郝慧俊,程玉藏,郑青如,刘航,
申请(专利权)人:中国铁塔股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。