当前位置: 首页 > 专利查询>武汉大学专利>正文

一种针对电商平台的联邦学习方法及系统技术方案

技术编号:39580833 阅读:10 留言:0更新日期:2023-12-03 19:31
本发明专利技术涉及一种针对电商平台的联邦学习方法及系统,涉及数据安全和隐私保护技术领域,包括根据客户端类型生成非独立同分布数据模型得到客户端偏度值;根据元参数从客户池中选定多个客户端作为训练数据的提供端;对联邦学习模型输出结果进行评价,并反馈调节元参数,直至模型评价结果到达预期

【技术实现步骤摘要】
一种针对电商平台的联邦学习方法及系统


[0001]本专利技术涉及数据安全和隐私保护
,特别涉及一种针对电商平台的联邦学习方法及系统


技术介绍

[0002]随着大数据时代的到来,智能手机和物联网设备正在产生指数级的数据量

这些大数据在推动数据科学和人工智能算法从实验室走向现实世界应用方面发挥着重要作用

[0003]然而,随着用户对数据隐私的要求越来越高,以及边缘端的计算能力不断增强,以联邦学习为代表的联邦优化技术得到了广泛的研究

对于任何一个联邦系统,由于原始数据必须以隐私保护的方式在本地处理,而客户端的各种情况极大地影响了联邦系统的效率

[0004]由于电商平台生成的数据分布在整个网络中,而在工业物联网中,由于设备的异构性和传感器数据的实时性,其数据的分布通常都是非独立同分布的

[0005]而在传统的机器学习中,模型的训练数据通常来自同一数据分布,这使得执行数据分析预测和训练机器学习模型变得异常困难,同时也对用户数据保护提出了挑战

[0006]现有的客户端输出的训练数据存在多层数据偏移和隐私问题,因此,现有的联邦系统性能无法满足需求


技术实现思路

[0007]为了解决现有技术中存在的问题,本申请实施例提供一种针对电商平台的联邦学习方法及系统,在保护数据隐私的同时,提高联邦学习的精度和泛化能力

[0008]第一方面,提供了一种针对电商平台的联邦学习方法,包括:
[0009]根据客户端类型生成非独立同分布数据模型,通过该模型识别客户池中所有客户端所处的偏度环境,并分别计算每个客户端的第一偏度值;
[0010]根据预先设定的元参数,从客户池中选定多个客户端作为训练数据的提供端,将提供端输出的训练数据输入到联邦学习模型中,得到模型输出结果;根据所有提供端的输出量计算得到数据量,根据所有提供端的第一偏度值计算得到第二偏度值,根据数据量和第二偏度值计算计算元参数,该元参数与第二偏度值呈正比;
[0011]根据预先设定的评价策略对模型输出结果进行评价,得到模型评价结果,根据模型输出结果和模型评价结果反馈调节元参数,直至模型评价结果到达预期

[0012]一些实施例中,所述偏度环境为均匀偏度环境

反帕累托偏度环境

以及狄利克雷偏度环境

[0013]一些实施例中,所述根据客户池中所有客户端所处的偏度环境,分别计算每个客户端的第一偏度值,具体包括如下步骤:
[0014]在判断所述偏度环境为均匀偏度环境时,将所有客户端均作为
α
支配性客户端计算所述第一偏度值;
[0015]在判断所述偏度环境为反帕累托偏度环境时,将所有客户端均作为
α
支配性客户端计算所述第一偏度值;
[0016]在判断所述偏度环境为狄利克雷偏度环境时,将所有客户端均作为
β
狄利克雷客户端计算所述第一偏度值

[0017]一些实施例中,所述方法还包括:
[0018]在计算所有客户端的第一偏度值后,根据第一偏度值由小至大对客户池中的所有客户端进行排序;
[0019]根据预先设定的元参数,从客户池中选定前
k
个客户端作为所述提供端,
k
为正整数

[0020]一些实施例中,所述根据模型输出结果和模型评价结果反馈调节所述元参数,具体包括如下步骤:
[0021]利用强化学习方法对所述模型输出结果和所述模型评价结果进行处理,得到处理结果,并根据所述处理结果反馈调节所述元参数;
[0022]所述处理方法包括强化学习方法

顺序选择方法

以及决策分析方法

[0023]一种针对电商平台的联邦学习系统,包括:
[0024]模型构建模块,其用于根据客户端类型生成非独立同分布数据模型,通过该模型识别客户池中所有客户端所处的偏度环境,并分别计算每个客户端的第一偏度值;
[0025]模型优化模块,其用于根据预先设定的初始的元参数,从客户池中选定多个客户端作为训练数据的提供端,将提供端输出的训练数据输入到联邦学习模型中,得到模型输出结果;还用于根据所有提供端的输出量计算得到数据量,根据所有提供端的第一偏度值计算得到第二偏度值,根据数据量和第二偏度值计算元参数,该元参数与第二偏度值呈正比;还用于根据预先设定的评价策略对模型输出结果进行评价,得到模型评价结果,根据模型输出结果和模型评价结果反馈调节元参数,直至模型评价结果到达预期

[0026]一些实施例中,所述偏度环境为均匀偏度环境

反帕累托偏度环境

以及狄利克雷偏度环境

[0027]一些实施例中,所述模型构建模块在判断所述偏度环境为均匀偏度环境时,将所有客户端均作为
α
支配性客户端计算所述第一偏度值;
[0028]所述模型构建模块在判断所述偏度环境为反帕累托偏度环境时,将所有客户端均作为
α
支配性客户端计算所述第一偏度值;
[0029]所述模型构建模块在判断所述偏度环境为狄利克雷偏度环境时,将所有客户端均作为
β
狄利克雷客户端计算所述第一偏度值

[0030]一些实施例中,所述模型构建模块还用于在计算所有客户端的第一偏度值后,根据第一偏度值由小至大对客户池中的所有客户端进行排序;
[0031]所述模型优化模块根据预先设定的元参数,从客户池中选定前
k
个客户端作为所述提供端,
k
为正整数

[0032]一些实施例中,所述模型优化模块利用强化学习方法对所述模型输出结果和所述模型评价结果进行处理,得到处理结果,并根据所述处理结果反馈调节所述元参数;
[0033]所述处理方法包括强化学习方法

顺序选择方法

以及决策分析方法

[0034]本申请提供的技术方案带来的有益效果包括:
[0035]通过构建针对电商平台数据特性的非独立同分布数据模型来推断客户端的数据异构性和进行隐私保护,通过引入元参数平衡联邦学习模型训练所需数据量和训练数据总体偏度,提高训练数据质量,从而有效优化现有的联邦学习模型,使其适应电商平台数据的非独立同分布特性

[0036]模型预测精度方面,通过计算终端精度并与偏斜环境的退化效应相比较,精度得到了显著的提高

这表明该方法可以在不同的偏斜环境下实现更好的预测性能

[0037]收敛速度方面,与三种偏度环境
(
均匀

逆帕累托

狄利克雷...

【技术保护点】

【技术特征摘要】
1.
一种针对电商平台的联邦学习方法,其特征在于,包括:根据客户端类型生成非独立同分布数据模型,通过该模型识别客户池中所有客户端所处的偏度环境,并分别计算每个客户端的第一偏度值;根据预先设定的元参数,从客户池中选定多个客户端作为训练数据的提供端,将提供端输出的训练数据输入到联邦学习模型中,得到模型输出结果;根据所有提供端的输出量计算得到数据量,根据所有提供端的第一偏度值计算得到第二偏度值,根据数据量和第二偏度值计算计算元参数,该元参数与第二偏度值呈正比;根据预先设定的评价策略对模型输出结果进行评价,得到模型评价结果,根据模型输出结果和模型评价结果反馈调节元参数,直至模型评价结果到达预期
。2.
如权利要求1所述的针对电商平台的联邦学习方法,其特征在于,所述偏度环境为均匀偏度环境

反帕累托偏度环境

以及狄利克雷偏度环境
。3.
如权利要求2所述的针对电商平台的联邦学习方法,其特征在于,所述根据客户池中所有客户端所处的偏度环境,分别计算每个客户端的第一偏度值,具体包括如下步骤:在判断所述偏度环境为均匀偏度环境时,将所有客户端均作为
α
支配性客户端计算所述第一偏度值;在判断所述偏度环境为反帕累托偏度环境时,将所有客户端均作为
α
支配性客户端计算所述第一偏度值;在判断所述偏度环境为狄利克雷偏度环境时,将所有客户端均作为
β
狄利克雷客户端计算所述第一偏度值
。4.
如权利要求1所述的针对电商平台的联邦学习方法,其特征在于,所述方法还包括:在计算所有客户端的第一偏度值后,根据第一偏度值由小至大对客户池中的所有客户端进行排序;根据预先设定的元参数,从客户池中选定前
k
个客户端作为所述提供端,
k
为正整数
。5.
如权利要求1所述的针对电商平台的联邦学习方法,其特征在于,所述根据模型输出结果和模型评价结果反馈调节所述元参数,具体包括如下步骤:利用强化学习方法对所述模型输出结果和所述模型评价结果进行处理,得到处理结果,并根据所述处理结果反馈调节所述元参数;所述处理方法包括强化学习方法

顺序选择方法

以及决策分析方法
。6...

【专利技术属性】
技术研发人员:胡创徐峰闫伟林梁黄黄程大钊
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1