一种缺失数据处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:43156790 阅读:24 留言:0更新日期:2024-11-01 19:52
本申请公开了一种缺失数据处理方法、装置、存储介质及电子设备,涉及计算机技术领域,其中方法包括:首先获取远程对象存储中的待执行缺失数据处理任务、数据挖掘任务模块发送的任务注册信息和任务执行服务器发送的硬件资源信息;将待执行缺失数据处理任务按照预设时间滑动窗口进行划分,得到多个待执行子任务;依据任务注册信息,构建多个待执行子任务有向无环图,并基于有向无环图,生成多个待执行子任务的任务执行顺序;基于硬件资源信息和任务注册信息,按照任务执行顺序将多个待执行子任务依次分配至多个任务执行服务器。与目前现有技术相比,本申请可以合理优化任务执行顺序,提高任务的执行效率。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种缺失数据处理方法、装置、存储介质及电子设备


技术介绍

1、在数据挖掘过程中,缺失数据的清洗是一项关键步骤,缺失数据清洗是数据预处理阶段的一项重要任务,它涉及识别和处理数据集中存在的缺失值,以提高后续分析和建模的准确性。

2、目前,对缺失数据处理主要是通过用户将zookeeper集群将业务服务器集群与数据挖掘调度模块相连,通过zookeeper集群选择最合适运行挖掘任务的业务服务器,最终将任务推送至优选出的业务服务器执行数据挖掘操作。

3、然而,使用这种缺失数据挖掘方式,由于zookeeper集群使用的paxos算法的复杂性较高,会导致选择业务服务器的过程耗时较长、效率较低,进而导致业务服务器集群与数据挖掘调度模块之间的数据不一致,影响确实数据挖掘准确率。


技术实现思路

1、有鉴于此,本申请提供了一种缺失数据处理方法、装置、存储介质及电子设备,主要目的在于改善目前现有技术会导致选择业务服务器的过程耗时较长、效率较低,进而导致业务服务器集群与数据挖掘调度模块本文档来自技高网...

【技术保护点】

1.一种缺失数据处理方法,其特征在于,应用于任务调度服务器,包括:

2.根据权利要求1所述的方法,其特征在于,所述依据所述任务注册信息,构建所述多个待执行子任务有向无环图,并基于所述有向无环图,生成所述多个待执行子任务的任务执行顺序,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述硬件资源信息和所述任务注册信息,按照所述任务执行顺序将所述多个待执行子任务依次分配至所述多个任务执行服务器,包括:

4.根据权利要求3所述的方法,其特征在于,按照任务类型标签信息和所述任务注册信息,将所述多个待执行子任务依次分配至所述多个任务执行服务器,包括:<...

【技术特征摘要】

1.一种缺失数据处理方法,其特征在于,应用于任务调度服务器,包括:

2.根据权利要求1所述的方法,其特征在于,所述依据所述任务注册信息,构建所述多个待执行子任务有向无环图,并基于所述有向无环图,生成所述多个待执行子任务的任务执行顺序,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述硬件资源信息和所述任务注册信息,按照所述任务执行顺序将所述多个待执行子任务依次分配至所述多个任务执行服务器,包括:

4.根据权利要求3所述的方法,其特征在于,按照任务类型标签信息和所述任务注册信息,将所述多个待执行子任务依次分配至所述多个任务执行服务器,包括:

5.根据权利要求4所述的方法,其特征在于,在所述基于所述目标任务类型和所述任务类型标签信息,确定所述多个任务执行服务器中所述目标待执行子任务对应的候选任务执行服务器之后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,在所述基于所述硬件资源信息和所述任务注册信息,按照所述任务执行顺序将所述多个待执行子任务依次分配至所述多个任务执行服务器之后,所述方法还...

【专利技术属性】
技术研发人员:陈锃
申请(专利权)人:中移苏州软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1