缺失补全方法、装置、节点设备和计算机可读存储介质制造方法及图纸

技术编号:38102034 阅读:10 留言:0更新日期:2023-07-06 09:20
本申请公开了一种缺失补全方法、装置、节点设备和计算机可读存储介质,该方法包括:基于节点设备本地的样本时序数据和联邦指定模型进行纵向联邦学习,得到联邦目标模型;基于联邦学习系统中节点设备的联邦目标模型进行联邦填充,得到节点设备用于对时序数据进行缺失补全的初始生成器;基于初始生成器和样本时序数据在缺失补全任务上进行生成对抗训练,得到节点设备的目标判别器和目标生成器;基于目标生成器对测试时序数据进行缺失补全,得到测试补全数据,并基于目标判别器对测试补全数据的第一判别结果,确定是否将目标生成器作为节点设备的缺失补全模型。通过上述方式,能够提高缺失补全的精准度。高缺失补全的精准度。高缺失补全的精准度。

【技术实现步骤摘要】
缺失补全方法、装置、节点设备和计算机可读存储介质


[0001]本申请涉及人工智能
,特别是涉及一种缺失补全方法、装置、节点设备和计算机可读存储介质。

技术介绍

[0002]随着《网络安全法》、《数据安全法》、《个人信息保护法》的陆续出台,我国在数据安全和个人信息保护领域已形成较为完备的法律规范体系。越来越多的数据因为隐私等原因不再能出本地,导致数据采集越来越困难,且会出现大量缺失值。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种缺失补全方法、装置、节点设备和计算机可读存储介质,能够提高缺失补全的精准度。
[0004]为了解决上述技术问题,本申请第一方面提供了一种缺失补全方法,该方法包括:基于节点设备本地的样本时序数据和联邦指定模型进行纵向联邦学习,得到联邦目标模型;其中,样本时序数据中样本时间位置上标注有是否屏蔽数值;基于联邦学习系统中节点设备的联邦目标模型进行联邦填充,得到节点设备用于对时序数据进行缺失补全的初始生成器;基于初始生成器和样本时序数据在缺失补全任务上进行生成对抗训练,得到节点设备的目标判别器和目标生成器;基于目标生成器对测试时序数据进行缺失补全,得到测试补全数据,并基于目标判别器对测试补全数据的第一判别结果,确定是否将目标生成器作为节点设备的缺失补全模型。
[0005]为了解决上述技术问题,本申请第二方面提供了一种缺失补全装置,该装置包括联邦学习模块、联邦填充模块、生成对抗模块和补全测试模块;联邦学习模块用于基于节点设备本地的样本时序数据和联邦指定模型进行纵向联邦学习,得到联邦目标模型;其中,样本时序数据中样本时间位置上标注有是否屏蔽数值;联邦填充模块用于基于联邦学习系统中所述节点设备的联邦目标模型进行联邦填充,得到节点设备用于对时序数据进行缺失补全的初始生成器;生成对抗模块用于基于初始生成器和样本时序数据在缺失补全任务上进行生成对抗训练,得到节点设备的目标判别器和目标生成器;补全测试模块用于基于目标生成器对测试时序数据进行缺失补全,得到测试补全数据,并基于目标判别器对测试补全数据的第一判别结果,确定是否将目标生成器作为节点设备的缺失补全模型。
[0006]为了解决上述技术问题,本申请第三方面提供了一种节点设备,该节点设备包括通信电路、存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述的缺失补全方法。
[0007]为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,该计算机可读存储介质存储有能够被处理器运行的程序指令,程序指令用于实现上述的缺失补全方法。
[0008]上述技术方案,由于初始生成器是基于联邦指定模型进行多方、多轨联邦训练后
构建的,即,基于联邦指定模型进行多方、多轨联邦训练,以本地的样本时序数据进行生成对抗式初始生成器。故,初始生成器能够为多条不同的时间轨迹数据进行缺失补全,从而使得后续基于初始生成器得到的缺失补全模型能够为多条不同的时间轨迹数据进行缺失补全,解决了多轨数据的缺失补全问题。
[0009]另外,节点设备的目标判别器是由节点设备本地的样本时序数据生成构造的,能够提高后续得到的缺失补全模型的缺失补全的精准度,从而为之后的预测等功能提供准确的数据支撑。
附图说明
[0010]图1是本申请提供的缺失补全方法一实施例的流程示意图;
[0011]图2是本申请提供的各节点设备的交互示意图;
[0012]图3是图1所示步骤S13一实施例的流程示意图;
[0013]图4是本申请提供的缺失补全装置一实施例的结构示意图;
[0014]图5是本申请提供的电子设备一实施例的结构示意图;
[0015]图6是本申请提供的计算机可读存储介质一实施例的结构示意图。
具体实施方式
[0016]下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0017]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0018]本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
[0019]请参阅图1,图1是本申请提供的缺失补全方法一实施例的流程示意图。需注意的是,若有实质上相同的结果,本实施例并不以图1所示的流程顺序为限。如图1所示,本实施例包括:
[0020]步骤S11:基于节点设备本地的样本时序数据和联邦指定模型进行纵向联邦学习,得到联邦目标模型。
[0021]本实施例的方法用于对时序数据进行缺失补全,即,本实施例的方法用于对时序数据中的缺失值进行填充,缺失值填充的精准度较高;另外,本实施例的方法能够为多条不同的时间轨迹数据进行填充。其中,本文所述的时序数据的领域包括但不限于医疗领域、经济领域、地球科学领域等。另外,本文所述的时序数据包括但不限于不规则采样时间序列(ISTS,Irregularly sampled time series)数据、ISMTS数据等,在此不做具体限定。
[0022]本实施方式中,基于节点设备本地的样本时序数据和联邦指定模型进行纵向联邦学习,得到联邦目标模型;其中,样本时序数据中样本时间位置上标注有是否屏蔽数值。也就是说,节点设备利用本地的样本时序数据对联邦指定模型进行训练,得到联邦目标模型。
[0023]需要说明的是,联邦学习旨在保证大数据交换时的信息安全、保护终端数据和个人数据隐私、保障流程合法合规的前提下,在多参与方或者多计算机节点中开展高效率、安全、可靠的机器学习相关模型构建;其中,本文所述的节点设备为上述的参与方或者计算机节点,各参与方或者计算机节点均需要作为节点设备执行本申请提供的缺失补全方法。另外,纵向联邦学习一般是适用于数据集具有相同的样本空间、不同的特征空间的参与方所组成的联邦学习场景。
[0024]在一实施方式中,如图2所示,图2是本申请提供的各节点设备的交互示意图,节点设备(图2中的参与方A)指定联邦模型结构、模型超参数以及损失函数,生成联邦指定模型;然后,节点设备(图2中的参与方A)发送给其他节点设备(图2中的参与方B为其中一个节点设备),以使得各节点设备共同构建联邦目标模型,即,在其他节点设备接收到联邦指定模型后,会基于本地的样本时序数据和联邦指定模型进行纵向联邦学习,从而在后续融合各节点设备训练的模型而得到联邦目标模型。其中,在基于节点设备本地的样本时序数据和联邦指定模型进行纵向联邦学习,得到联邦目标模型中,会计算损失函数,以优化联邦指定模型而得到联邦目标模型。
[0025]在一具体实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种缺失补全方法,其特征在于,包括:基于节点设备本地的样本时序数据和联邦指定模型进行纵向联邦学习,得到联邦目标模型;其中,所述样本时序数据中样本时间位置上标注有是否屏蔽数值;基于所述联邦学习系统中所述节点设备的联邦目标模型进行联邦填充,得到所述节点设备用于对时序数据进行缺失补全的初始生成器;基于所述初始生成器和所述样本时序数据在缺失补全任务上进行生成对抗训练,得到所述节点设备的目标判别器和目标生成器;基于所述目标生成器对测试时序数据进行缺失补全,得到测试补全数据,并基于所述目标判别器对测试补全数据的第一判别结果,确定是否将所述目标生成器作为所述节点设备的缺失补全模型。2.根据权利要求1所述的方法,其特征在于,在确定不能将所述目标生成器作为所述缺失补全模型的情况下,在所述基于所述目标判别器对测试补全数据的第一判别结果,确定是否将所述目标生成器作为所述节点设备的缺失补全模型之后,所述方法还包括:将所述联邦目标模型作为新的联邦指定模型;基于所述新的联邦指定模型,重新执行所述基于节点设备本地的样本时序数据和联邦指定模型进行纵向联邦学习,得到联邦目标模型的步骤以及后续步骤,直至确定将最新训练的目标生成器作为所述缺失补全模型为止。3.根据权利要求1所述的方法,其特征在于,所述测试时序数据中测试时间位置上标注有是否屏蔽数值,所述第一判别结果至少包括所述测试补全数据在标注屏蔽数值的测试时间位置上的补全数值经所述判别器判别为假的第一概率值,所述基于所述目标判别器对测试补全数据的第一判别结果,确定是否将所述目标生成器作为所述节点设备的缺失补全模型,包括以下至少一者:响应于所述第一概率值之和大于预设阈值,确定不能将所述目标生成器作为所述缺失补全模型;响应于所述第一概率值之和不大于所述预设阈值,确定将所述目标生成器作为所述缺失补全模型。4.根据权利要求1或3所述的方法,其特征在于,在所述基于所述目标生成器对测试时序数据进行缺失补全,得到测试补全数据之后,以及在所述基于所述目标判别器对测试补全数据的第一判别结果,确定是否将所述目标生成器作为所述节点设备的缺失补全模型之前,所述方法还包括:基于所述测试时序数据中标注屏蔽数值的测试时间位置,生成测试提示数据;其中,所述测试提示数据中提示有所述测试时间位置上屏蔽数值的概率值;所述目标判别器对测试补全数据的第一判别结果的获取步骤,包括:基于所述测试提示数据利用所述目标判别器对所述测试补全数据进行判别,得到所述第一判别结果。5.根据权利要求4所述的方法,其特征在于,所述基于所述测试时序数据中标注屏蔽数值的测试时间位置,生成测试提示数据,包括:选择所述测试时序数据中标注屏蔽数值的至少一个测试时间位置,作为第一测试位置,并选择所述测试时序数据中未标注屏蔽数值的至少一个测试时间位置,作为第二测试
位置;在所述第一测试位置之外标注屏蔽数值的测试时间位置填充第一数值,并在所述第二测试位置之外标注未屏蔽数值的测试位...

【专利技术属性】
技术研发人员:戴俊陈巍汪晶贺茂华
申请(专利权)人:讯飞华中武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1