【技术实现步骤摘要】
本专利技术涉及一种数据预测,尤其涉及一种用于纵向联邦学习的数据缺失值补全方法及相关设备。
技术介绍
1、随着时代的发展,人们对于个人数据的隐私保护的需求越来越强烈,欧盟、美国、中国相继出台了各种相关政策。在过去的几年人工智能迅猛发展,机器学习、计算机视觉、自然语言处理、深度学习这些人工智能方法都是建立在大数据基础之上的,但是随着法律的环境越来越严峻,在很多情况下建模之前所获得的数据规模都无法达到训练要求,比如数据量比较少、缺少标签或者某些特征数值等。
2、由于现在数据无法直接进行交易,因此形成了数据孤岛,联邦学习应运而生。联邦学习是一种基于分布式数据集的机器学习模型,现有的基于联邦学习的缺失补全方法有最大值补全、最小值补全和均值补全等,但最大值补全、最小值补全和均值补全等方法都是恒值补全方式,未考虑到数据的原有分布情况,使得补全结果的准确性较低。
技术实现思路
1、有鉴于此,本专利技术提供了一种用于纵向联邦学习的数据缺失值补全方法及相关设备,用于解决现有技术中未考虑到数据的原有
...【技术保护点】
1.一种用于纵向联邦学习的数据缺失值补全方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述控制所述参与方在样本索引集合选取初始样本点索引,并根据所述初始样本点索引确定目标样本点的步骤,包括:
3.根据权利要求1所述的方法,其特征在于,在所述控制所述参与方根据所述左叶子节点索引集合和所述右叶子节点索引集合构建索引树的步骤之前,还包括:
4.根据权利要求2所述的方法,其特征在于,在所述索引树的各个叶子节点遍历缺失位置,得到所述缺失位置在所述索引树上叶子节点的目标索引集的步骤之前,还包括:
5.根据权利要
...【技术特征摘要】
1.一种用于纵向联邦学习的数据缺失值补全方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述控制所述参与方在样本索引集合选取初始样本点索引,并根据所述初始样本点索引确定目标样本点的步骤,包括:
3.根据权利要求1所述的方法,其特征在于,在所述控制所述参与方根据所述左叶子节点索引集合和所述右叶子节点索引集合构建索引树的步骤之前,还包括:
4.根据权利要求2所述的方法,其特征在于,在所述索引树的各个叶子节点遍历缺失位置,得到所述缺失位置在所述索引树上叶子节点的目标索引集的步骤之前,还包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标索引集确定近邻...
【专利技术属性】
技术研发人员:杜文友,申嘉明,孟光磊,焦耀光,
申请(专利权)人:沈阳航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。