【技术实现步骤摘要】
数据准确性检测方法、装置、服务器及计算机存储介质
本专利技术涉及大数据处理
,尤其涉及一种数据准确性检测方法、装置、服务器及计算机存储介质。
技术介绍
随着移动互联网、可穿戴设备、物联网等领域应用的快速增长,数据的规模也出现爆炸性增长,预计到2020年全球数据规模将达到40ZB(Zettabyte,泽字节),数据正成为巨大的经济资产。大数据处理过程中,数据质量的好坏将直接影响到分析结果的准确性。因此,大数据不仅仅是数据量巨大,还对数据的质量有一定的要求。然而,现实中的大数据处理,其数据来源和数据结构繁多复杂。如何衡量数据清洗结果的准确性是大数据应用的重点也是难点,因此,如何对清洗后的大数据进行有效的准确性检查成为了亟待解决的重要问题。目前,业界对数据准确性的校验没有统一的方法,例如,有的数据检测平台会以字段为单位对每个字段下的数据进行检测,由于需要对每个字段下的数据进行验证,计算检测的复杂度就比较高,也比较浪费系统资源。
技术实现思路
本专利技术实施例提供的一种数据准确性检测方法、装置、服务器及计算机存储介质,主要解决的技术问题是:提供一种新的数据准确性检测方法 ...
【技术保护点】
1.一种数据准确性检测方法,包括:确定当前待检查的待测对象;根据所述待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与所述待测对象对应的指标模型;每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值;根据获取的指标模型提取所述待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值;将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定所述待测对象各测量指标对应的被测数据是否准确。
【技术特征摘要】
1.一种数据准确性检测方法,包括:确定当前待检查的待测对象;根据所述待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与所述待测对象对应的指标模型;每一指标模型中包含有待测对象的测量指标、各测量指标对应的被测数据、各测量指标对应的计算模型、以及各测量指标对应的指标阈值;根据获取的指标模型提取所述待测对象各测量指标对应的被测数据,并分别带入各测量指标对应的计算模型计算得到各测量指标的指标值;将计算得到的各测量指标的指标值分别与各测量指标对应的指标阈值进行比较,根据比较结果确定所述待测对象各测量指标对应的被测数据是否准确。2.如权利要求1所述的数据准确性检测方法,其特征在于,所述待测对象与指标模型对应关系表中包含待测逻辑组对象与指标模型组的对应关系,所述待测逻辑组对象中包含至少一个待测业务对象,与所述待测逻辑组对象对应的指标模型组中包括与所述待测逻辑组对象中各待测业务对象分别对应的指标模型;所述确定当前待检查的待测对象包括:接收检测指令信息;从所述检测指令信息中提取当前待检查的待测逻辑组对象,所述待测逻辑组对象中包含至少一个待测业务对象。3.如权利要求1所述的数据准确性检测方法,其特征在于,所述被测数据为所述待测对象各测量指标所对应的测量字段下的数据;所述根据获取的指标模型提取所述待测对象各测量指标对应的被测数据包括:根据获取的指标模型从清洗后的数据表中提取所述待测对象各测量指标对应的测量字段下的数据。4.如权利要求1-3任一项所述的数据准确性检查方法,其特征在于,所述根据比较结果确定所述待测对象各测量指标对应的被测数据是否准确包括:在所述待测对象的某一测量指标的指标值与所述待测对象相应测量指标的指标阈值相匹配时,判定该测量指标所对应的被测数据准确,否则,判定该测量指标所对应的被测数据不准确。5.如权利要求1-3任一项所述的数据准确性检测方法,其特征在于,所述根据所述待测对象和预设待测对象与指标模型对应关系表从模型数据库中获取与所述待测对象对应的指标模型之前还包括:判断所述待测对象与指标模型对应关系表中是否存在所述当前待检测的待测对象与指标模型的对应...
【专利技术属性】
技术研发人员:刘茂才,向春,袁志凯,冯双举,
申请(专利权)人:中兴通讯股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。