【技术实现步骤摘要】
数据治理方法、装置、设备和存储介质
[0001]本专利技术涉及数据处理
,尤其涉及一种数据治理方法
、
装置
、
设备和存储介质
。
技术介绍
[0002]资源池
(Resources Pool)
作为计算资源
、
存储资源和网络资源等多种资源的集合,实现了软
、
硬件资源的动态分配和调度使用,满足了云计算基础设施的需求
。
[0003]通常资源池中的资源是有限的,当资源池中运行的任务超过一定数量时,会出现任务延迟等情况,例如某一任务未按预定时间点开始,或者是未按预定时间点结束等
。
[0004]但是,在资源池的实际使用过程中,任务延迟并不一定是由于资源池的资源不足而导致的,如果盲目的选择购买资源,对资源池进行扩容,可能会导致资源的浪费,并不能真正的解决任务延迟的问题
。
为此,亟需一种数据治理方法,用以确定任务延迟的原因,治理任务延迟,避免资源浪费
。
技术实现思路
[0005]本专利技术实施例提供一种数据治理方法
、
装置
、
设备和存储介质,用以对需要被治理的目标任务进行针对性的故障治理,避免资源浪费
。
[0006]第一方面,本专利技术实施例提供一种数据治理方法,所述方法包括:
[0007]响应于数据治理任务的触发,获取至少一个任务在预设时间段内的实际运行状态信息,以及所述至少一个任务对应的 ...
【技术保护点】
【技术特征摘要】
1.
一种数据治理方法,其特征在于,包括:响应于数据治理任务的触发,获取至少一个任务在预设时间段内的实际运行状态信息,以及所述至少一个任务对应的参考运行状态信息;根据所述实际运行状态信息和所述参考运行状态信息,确定所述至少一个任务中需要被治理的目标任务;根据所述目标任务的所述实际运行状态信息,确定所述目标任务的故障类型;根据所述故障类型,确定所述目标任务的数据治理方案
。2.
根据权利要求1所述的方法,其特征在于,所述实际运行状态信息包括所述至少一个任务各自从开始调度至结束运行的第一总处理时长以及所述至少一个任务分别对应的运行状态指示标识,所述参考运行状态信息包括所述至少一个任务各自从开始调度至运行结束的第二总处理时长;所述根据实际运行状态信息和所述参考运行状态信息,确定所述至少一个任务中需要被治理的目标任务,包括:确定所述至少一个任务中所述第一总处理时长与所述第二总处理时长的第一差值大于预设的第一时间阈值的任务为需要被治理的目标任务,或者,确定所述至少一个任务中所述运行状态指示标识指示存在运行故障的任务为需要被治理的目标任务
。3.
根据权利要求2所述的方法,其特征在于,所述实际运行状态信息还包括:所述至少一个任务各自的计划调度时刻
、
实际调度时刻以及任务调度完成后至任务开始运行前的等待时长;所述根据所述目标任务的所述实际运行状态信息,确定所述目标任务的故障类型,包括:若所述目标任务的实际调度时刻晚于计划调度时刻,则确定所述目标任务的故障类型为调度资源不足;若所述目标任务的实际调度时刻不晚于计划调度时刻,且所述目标任务对应的所述等待时长大于预设的第二时间阈值,则确定所述目标任务的故障类型为运行资源不足;所述根据所述故障类型,确定所述目标任务的数据治理方案,包括:若所述故障类型为所述调度资源不足或所述运行资源不足,则从资源池中预留资源给所述目标任务,以使所述目标任务在运行时使用所述预留资源
。4.
根据权利要求2所述的方法,其特征在于,所述实际运行状态信息还包括:所述至少一个任务各自的开始运行时刻
、
结束运行时刻以及各任务的复杂度;所述根据所述目标任务的所述实际运行状态信息,确定所述目标任务的故障类型,包括:若所述目标任务的开始运行时刻至结束运行时刻的第二差值大于预设的第三时间阈值,且所述目标任务的复杂度大于预设的复杂度阈值,则确定所述目标任务的故障类型为数据结构异常;所述根据所述故障类型,确定所述目标任务的数据治理方案,包括:若所述故障类型为所述数据结构异常,则根据所述数据结构对应的异常类型,确定所述目标任务的数据结构优化方案
。5.
根据权利要求4所述的方法,其特征在于,所述...
【专利技术属性】
技术研发人员:杨铮,刘明贵,
申请(专利权)人:天津五八到家科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。