一种缺失值的预测方法及装置、可读存储介质制造方法及图纸

技术编号:31317085 阅读:24 留言:0更新日期:2021-12-12 23:56
本申请提供一种缺失值的预测方法及装置、可读存储介质。缺失值的预测方法包括:获取待处理的数据集,其中包括多维度的简历数据,每一维度的简历数据均为多个,且均包括缺失值和非缺失值;确定各维度的简历数据的缺失值预测顺序;按照缺失值预测顺序,分别确定各维度的简历数据中的缺失值的预测值;针对任一维度的简历数据,确定该维度的简历数据中的缺失值的预测值,包括:确定该维度与其他维度之间的相关性;根据相关性从其他维度中确定多个目标维度;对各目标维度的简历数据中的缺失值进行填充;基于各目标维度填充后的简历数据,和该维度的简历数据中的非缺失值确定该维度的简历数据中的缺失值的预测值。该预测方法用以提高缺失值的预测精度。缺失值的预测精度。缺失值的预测精度。

【技术实现步骤摘要】
一种缺失值的预测方法及装置、可读存储介质


[0001]本申请涉及数据处理
,具体而言,涉及一种缺失值的预测方法及装置、可读存储介质。

技术介绍

[0002]在简历数据中,通常会存在着缺失值,缺失值即用户在填写简历时没有填写的值。在对简历数据进行处理时,需要将该部分缺失值进行填充。
[0003]现有技术中,通过中值预测算法、众数预测算法等传统算法实现缺失值的预测。这种基于统计算法的预测方式,预测精度较低。

技术实现思路

[0004]本申请实施例的目的在于提供一种缺失值的预测方法及装置、可读存储介质,用以提高缺失值的预测精度。
[0005]第一方面,本申请实施例提供一种缺失值的预测方法,包括:获取待处理的数据集;所述待处理的数据集中包括多维度的简历数据,每一维度的简历数据均为多个,每一维度的简历数据均包括缺失值和非缺失值;确定各维度的简历数据的缺失值预测顺序;按照所述缺失值预测顺序,分别确定各维度的简历数据中的缺失值的预测值;其中,针对任一维度的简历数据,确定该维度的简历数据中的缺失值的预测值,包括:确定该维度本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种缺失值的预测方法,其特征在于,包括:获取待处理的数据集;所述待处理的数据集中包括多维度的简历数据,每一维度的简历数据均为多个,每一维度的简历数据均包括缺失值和非缺失值;确定各维度的简历数据的缺失值预测顺序;按照所述缺失值预测顺序,分别确定各维度的简历数据中的缺失值的预测值;其中,针对任一维度的简历数据,确定该维度的简历数据中的缺失值的预测值,包括:确定该维度与其他维度之间的相关性;根据所述相关性从所述其他维度中确定多个目标维度;对各目标维度的简历数据中的缺失值进行填充;基于各目标维度的填充后的简历数据,以及该维度的简历数据中的非缺失值确定该维度的简历数据中的缺失值的预测值。2.根据权利要求1所述的预测方法,其特征在于,所述获取待处理的数据集,包括:获取多个待处理的简历;所述待处理的简历为需要预测缺失值的简历;从所述多个待处理的简历的简历数据中确定出所述待处理的数据集。3.根据权利要求1所述的预测方法,其特征在于,所述确定各维度的简历数据的缺失值预测顺序,包括:确定各维度的简历数据各自的缺失值的数量;根据各维度的简历数据各自的缺失值的数量确定所述缺失值预测顺序。4.根据权利要求1所述的预测方法,其特征在于,所述确定该维度与其他维度之间的相关性,包括:基于MIC相关性分析算法,确定该维度与其他维度之间的相关性。5.根据权利要求1所述的预测方法,其特征在于,所述根据所述相关性从所述其他维度中确定多个目标维度,包括:将所述其他维度中相关性满足第一预设条件的维度确定为第一目标维度;将所述其他维度中相关性满足第二预设条件的维度确定为第二目标维度;所述第二目标维度与该维度之间的相关性小于所述第一目标维度与该维度之间的相关性;根据所述第一目标维度和所述第二目标维度确定所述多个目标维度。6.根据权利要求5所述的预测方法,其特征在于,所述根据所述第一目标维度和所述第二目标维度确定所述多个目标维度,包括:对所述第二目标维度进行降维处理,获得降维...

【专利技术属性】
技术研发人员:储开龙时宝旭李文勇
申请(专利权)人:湖北天天数链技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1