【技术实现步骤摘要】
历史数据清理方法及装置
本专利技术涉及数据清理
,尤其涉及一种历史数据清理方法及装置。
技术介绍
在很多领域的应用系统数据库中,每日都会新增大量数据,数据库的存量数据呈现持续增长的状态。随着数据量的上升,如果不能有效地控制在线数据规模,将影响生产数据访问效率、及应用系统运行的整体效率。因此,需定期扫描应用数据,将超过一定保存时间、不再具有使用价值的数据进行删除。对于历史数据的清理,目前主要方法如下:建配置文件,逐一扫描配置文件中的记录,对相应的数据库中的表的数据进行删除。该方法存在以下弊端:(1)这种方式仅适用于最简单的数据迁移清理场景,可扩展性差、无法在各系统中直接复用;(2)对于表结构等环境的要求较高,无法自动调整迁移清理策略;(3)不支持并发处理,在多表大数据量的情况下效率无法满足。针对上述问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术提供了一种历史数据清理方法及装置,以至少解决现有技术中的历史数据清理方法无法在各系统中直接复用、不支持并发处理的问题。根据本专利技术的一个方面,提供了一种历史数据清理方法,包括:根据预设的系统启动时间自动启动历史数据清理流程,获取清理策略配置文件,并根据所述清理策略配置文件生成至少一个清理任务;根据历史任务处理时间,计算每个清理任务的预计处理时间;按照所述预计处理时间,将待分配任务队列中的所述至少一个清理任务分配给空闲的清理单元,其中,所述清理单元依次对分配给自身的清理任务进行处理,并在每个清理任务处理完毕后输出对应的任务处理状态;根据所述任务处理状态判断处理是否成功,如果失败,则将处理失败的清理任务的 ...
【技术保护点】
一种历史数据清理方法,其特征在于,包括:根据预设的系统启动时间自动启动历史数据清理流程,获取清理策略配置文件,并根据所述清理策略配置文件生成至少一个清理任务;根据历史任务处理时间,计算每个清理任务的预计处理时间;按照所述预计处理时间,将待分配任务队列中的所述至少一个清理任务分配给空闲的清理单元,其中,所述清理单元依次对分配给自身的清理任务进行处理,并在每个清理任务处理完毕后输出对应的任务处理状态;根据所述任务处理状态判断处理是否成功,如果失败,则将处理失败的清理任务的状态改为待分配,放入所述待分配任务队列,等待重新进行分配。
【技术特征摘要】
1.一种历史数据清理方法,其特征在于,包括:根据预设的系统启动时间自动启动历史数据清理流程,获取清理策略配置文件,并根据所述清理策略配置文件生成至少一个清理任务;根据历史任务处理时间,计算每个清理任务的预计处理时间;按照所述预计处理时间,将待分配任务队列中的所述至少一个清理任务分配给空闲的清理单元,其中,所述清理单元依次对分配给自身的清理任务进行处理,并在每个清理任务处理完毕后输出对应的任务处理状态;根据所述任务处理状态判断处理是否成功,如果失败,则将处理失败的清理任务的状态改为待分配,放入所述待分配任务队列,等待重新进行分配;在根据预设的系统启动时间自动启动历史数据清理流程之前,所述方法还包括:根据用户输入的信息生成系统配置文件和所述清理策略配置文件,并存储所述系统配置文件和所述清理策略配置文件;其中,所述系统配置文件包括:系统启动时间和重复清理次数;所述清理策略配置文件包括:数据库用户名、表名、清理频率、字段名、清理条件、是否需要备份和备份模式;所述清理单元依次对分配给自身的清理任务进行处理,包括:所述清理单元从所述清理任务中获取清理参数信息,其中,所述清理参数信息包括:数据库用户名、表名、清理频率、字段名、清理条件;所述清理单元结合清理数据量、全量数据量、预计处理时间和表结构,确定清理模式以及是否需要对表结构进行分区处理,其中,所述清理模式包括以下至少之一:删除模式、截断模式;所述清理单元根据所述清理模式和分区处理结果对所述清理任务进行清理。2.根据权利要求1所述的方法,其特征在于,按照所述预计处理时间,将待分配任务队列中的所述至少一个清理任务分配给空闲的清理单元,包括:检测所述待分配任务队列中是否存在待分配的清理任务;如果存在待分配的清理任务,检测是否存在空闲的清理单元,如果存在空闲的清理单元,则按照所述待分配的清理任务对应的预计处理时间,将所述待分配的清理任务分配给空闲的清理单元;如果不存在空闲的清理单元,则继续检测是否存在空闲的清理单元,直到所述待分配任务队列中所有清理任务的状态都是已分配;如果不存在待分配的清理任务,则继续检测所述待分配任务队列中是否存在待分配的清理任务,直到所述待分配任务队列中所有清理任务的状态都是已完成。3.根据权利要求1至2中任一项所述的方法,其特征在于,在按照所述预计处理时间,将待分配任务队列中的所述至少一个清理任务分配给空闲的清理单元之前,所述方法还包括:判断待分配的清理任务是否需要备份;如果需要备份,则生成与所述待分配的清理任务对应的备份任务,并按照所述待分配的清理任务对应的预计处理时间,将所述备份任务分配给空闲的备份单元;如果不需要备份或者备份完毕,则按照所述待分配的清理任务...
【专利技术属性】
技术研发人员:陈霞,陆登,刘姗姗,王斑,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。