The present disclosure relates to devices and methods for judging data status and devices and methods for data updating. The methods of judging data state include: configuring a check field for each data including incremental data and target data, the value of the check field is determined by all non-primary key fields of the corresponding data, and the value of the check field is different for non-primary key fields whose values are not identical; comparing the incremental data with the primary key fields of the target data If different, the state of incremental data is judged to be new, and if the same, whether the check field of incremental data is the same as that of target data is compared; if the check field of incremental data is different from that of target data, the state of incremental data is judged to be modified, and if the same, the state of incremental data is judged to be unchanged. By introducing the check field, when judging the state of incremental data, it avoids the manual repeated coding of different non-primary key fields, and greatly improves the judgment efficiency.
【技术实现步骤摘要】
判断数据状态的装置和方法以及数据更新的装置和方法
本专利技术涉及数据仓库领域,尤其是判断数据状态的装置和方法以及数据更新的装置和方法,以及一种存储有执行所述判断数据状态的方法的指令的计算机可读存储介质。
技术介绍
随着互联网和移动互联网的飞速发展,大型电信行业公司和电子商务公司,在日常运营中生产出的数据量越来越大。这些数据含有的信息量越来越多,越来越多元化,越来越复杂,并呈现爆发式增长。为了对数据进行有效存储,通常会先从企业日常运营生产的数据中抽取出增量数据,然后判定增量数据的变化状态,所述增量数据有三种变化状态,分别是新增、修改和不变三种。再将其中新增或修改的信息添加到企业的全量数据库中。在对海量数据的存储应用中,如何根据增量数据的状态来更新全量数据,确保增量数据所包含的新增信息,全部添加到全量数据中,使得全量数据在不增加冗余数据的基础上完成更新,是每一个拥有大数据量的企业都会碰到的问题。相关技术中判定增量数据状态,更新全量数据的方法有两种。第一种是直接将增量数据和全量数据进行对比,判定增量数据状态,并根据增量数据状态更新全量数据表。第二种是先从全量数据中截取一段周期的数据与增量数据进行对比,判定增量数据状态,再根据增量数据状态更新所述截取出的部分全量数据,最后将这部分截取出的部分全量数据表插回到全量数据中。无论采用上述哪种方法,均需判定增量数据的变化状态,现有的判定增量数据状态方法是,取主键相同的增量数据与目标数据,对增量数据与目标数据的每一个非主键字段进行比较,判定增量数据的变化状态。
技术实现思路
相关技术方案中存在如下问题。例如,采用直接将全量数据整 ...
【技术保护点】
1.一种判断数据状态的方法,包括:给包括增量数据和目标数据的所有数据中的每一条数据都配置一个校验字段,所述校验字段的值由相应数据的全部非主键字段确定,对于值不完全相同的非主键字段,所确定的校验字段的值也不同;将增量数据与目标数据的主键字段进行比较,如果增量数据与目标数据的主键字段不同,则判断增量数据的状态为新增;如果增量数据与目标数据的主键字段相同,则比较增量数据与目标数据的校验字段是否相同,如果增量数据与目标数据的校验字段不同,则判断增量数据的状态为修改,如果增量数据与目标数据的校验字段相同,则判断增量数据的状态为不变。
【技术特征摘要】
1.一种判断数据状态的方法,包括:给包括增量数据和目标数据的所有数据中的每一条数据都配置一个校验字段,所述校验字段的值由相应数据的全部非主键字段确定,对于值不完全相同的非主键字段,所确定的校验字段的值也不同;将增量数据与目标数据的主键字段进行比较,如果增量数据与目标数据的主键字段不同,则判断增量数据的状态为新增;如果增量数据与目标数据的主键字段相同,则比较增量数据与目标数据的校验字段是否相同,如果增量数据与目标数据的校验字段不同,则判断增量数据的状态为修改,如果增量数据与目标数据的校验字段相同,则判断增量数据的状态为不变。2.一种判断数据状态的方法,包括:将增量数据与目标数据的主键字段进行比较,如果增量数据与目标数据的主键字段不同,则判断增量数据的状态为新增;如果增量数据与目标数据的主键字段相同,则给包括主键字段相同的增量数据和目标数据的所有数据中的每一条数据都配置一个校验字段,所述校验字段的值由相应数据的全部非主键字段确定,对于值不完全相同的非主键字段,所确定的校验字段的值也不同,比较增量数据与目标数据的校验字段是否相同,如果增量数据与目标数据的校验字段不同,则判断增量数据的状态为修改,如果增量数据与目标数据的校验字段相同,则判断增量数据的状态为不变。3.根据权利要求1或2所述的方法,其中,所述目标数据是全量数据的一部分或者是全量数据的整体。4.根据权利要求1或2所述的方法,其中,校验字段的值由如下方法确定:将所述每一条数据的每一条非主键字段的值分别作为HASHCODE算法的输入参数进行计算;对每个非主键字段的计算结果进行汇总,得到汇总值;将所述汇总值作为HASHCODE算法的输入参数再次进行计算;将所述汇总值的计算结果作为相应的每一条数据的校验字段的值。5.根据权利要求1或2所述的...
【专利技术属性】
技术研发人员:蔡海敏,童新旺,吕金鹏,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。