一种用于纵向联邦学习的数据缺失值补全方法及相关设备技术

技术编号:45514088 阅读:27 留言:0更新日期:2025-06-13 17:19
本发明专利技术实施例公开了一种用于纵向联邦学习的数据缺失值补全方法及相关设备,方法包括:控制协同方生成同态加密的公钥和私钥,并将公钥发送至与协同方对应的参与方;控制参与方在样本索引集合选取初始样本点索引,并确定目标样本索引;控制参与方通过目标样本点计算参与方的截距以及加密距离矩阵;通过协同方分别对截距和加密距离矩阵进行聚合,得到全局截距和目标距离矩阵;根据全局截距和目标距离矩阵对目标样本点所在的样本集进行划分,得到左、右叶子节点索引集合;根据左、右叶子节点索引集合构建索引树,通过遍历得到目标索引集;根据目标索引集确定近邻索引集,并根据近邻索引集预测缺失位置的数据缺失值。

【技术实现步骤摘要】

本专利技术涉及一种数据预测,尤其涉及一种用于纵向联邦学习的数据缺失值补全方法及相关设备


技术介绍

1、随着时代的发展,人们对于个人数据的隐私保护的需求越来越强烈,欧盟、美国、中国相继出台了各种相关政策。在过去的几年人工智能迅猛发展,机器学习、计算机视觉、自然语言处理、深度学习这些人工智能方法都是建立在大数据基础之上的,但是随着法律的环境越来越严峻,在很多情况下建模之前所获得的数据规模都无法达到训练要求,比如数据量比较少、缺少标签或者某些特征数值等。

2、由于现在数据无法直接进行交易,因此形成了数据孤岛,联邦学习应运而生。联邦学习是一种基于分布式数据集的机器学习模型,现有的基于联邦学习的缺失补全方法有最大值补全、最小值补全和均值补全等,但最大值补全、最小值补全和均值补全等方法都是恒值补全方式,未考虑到数据的原有分布情况,使得补全结果的准确性较低。


技术实现思路

1、有鉴于此,本专利技术提供了一种用于纵向联邦学习的数据缺失值补全方法及相关设备,用于解决现有技术中未考虑到数据的原有分布情况,使得补全结本文档来自技高网...

【技术保护点】

1.一种用于纵向联邦学习的数据缺失值补全方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述控制所述参与方在样本索引集合选取初始样本点索引,并根据所述初始样本点索引确定目标样本点的步骤,包括:

3.根据权利要求1所述的方法,其特征在于,在所述控制所述参与方根据所述左叶子节点索引集合和所述右叶子节点索引集合构建索引树的步骤之前,还包括:

4.根据权利要求2所述的方法,其特征在于,在所述索引树的各个叶子节点遍历缺失位置,得到所述缺失位置在所述索引树上叶子节点的目标索引集的步骤之前,还包括:

5.根据权利要求1所述的方法,其特...

【技术特征摘要】

1.一种用于纵向联邦学习的数据缺失值补全方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述控制所述参与方在样本索引集合选取初始样本点索引,并根据所述初始样本点索引确定目标样本点的步骤,包括:

3.根据权利要求1所述的方法,其特征在于,在所述控制所述参与方根据所述左叶子节点索引集合和所述右叶子节点索引集合构建索引树的步骤之前,还包括:

4.根据权利要求2所述的方法,其特征在于,在所述索引树的各个叶子节点遍历缺失位置,得到所述缺失位置在所述索引树上叶子节点的目标索引集的步骤之前,还包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述目标索引集确定近邻...

【专利技术属性】
技术研发人员:杜文友申嘉明孟光磊焦耀光
申请(专利权)人:沈阳航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1