基于联邦学习的用户数据分类方法、装置、设备及介质制造方法及图纸

技术编号:26762598 阅读:41 留言:0更新日期:2020-12-18 23:13
本申请涉及信息安全技术领域,揭露一种基于联邦学习的用户数据分类方法、装置、设备及介质,其中方法包括获取训练数据,并通过训练数据训练本地模型,并基于每个训练循环期间本地模型的权重矩阵的变化梯度,生成梯度矩阵,将预先设定的上载速率的作为通道选择阈值,从计算结果中,选择符合所述通道选择阈值的通道,作为目标通道,并将目标通道中的梯度矩阵作为目标梯度矩阵;选择参数非零目标梯度矩阵,作为服务器的权重;根据服务器的权重,对本地模型进行更新,并根据更新后的本地模型对用户数据进行分类。本申请还涉及区块链技术,训练数据存储于区块链中。本申请通过生成更新后的本地模型,实现在用户数据分类时,保护用户隐私数据安全。

【技术实现步骤摘要】
基于联邦学习的用户数据分类方法、装置、设备及介质
本申请涉及信息安全
,尤其涉及基于联邦学习的用户数据分类方法、装置、设备及介质。
技术介绍
一方面随着法律法规的不断完善以及监控的不断加强,数据的集中式处理将面临巨大的法律风险;另一方面各个数据拥有方之间出于安全、经济利益等因素不愿意共享原始数据。这些因素都会导致数据以孤岛的形式存在。为了打破数据孤岛,联邦学习应运而生。联邦学习无须各数据拥有方共享原始数据,可以在保证安全性的条件下,充分地利用各数据拥有方的原始数据进行模型训练,有效解决了人工智能时代的数据孤岛问题。目前基于联邦学习的用户数据分类方法为:通过服务器节点将待训练模型下发至多个工作节点,各工作节点基于各自所拥有的数据对接收到的待训练模型进行训练,并将训练好的模型参数回传至服务器节点,服务器节点根据接收到的各工作节点的模型参数对待训练模型进行更新,然后重复上述过程直至待训练模型满足预设的性能指标,再通过符合预设性能指标的训练模型对用户数据进行分类。但是,在这种分类方法过程中,训练数据都共享给执行分析的中央服务器,而提供数据本文档来自技高网...

【技术保护点】
1.一种基于联邦学习的用户数据分类方法,其特征在于,包括:/n获取训练数据,通过所述训练数据训练本地模型,并基于每个训练循环期间所述本地模型的权重矩阵的变化梯度,生成梯度矩阵;/n计算所述梯度矩阵的通道的欧几里得范数,得到计算结果,并将所述计算结果以张量的形式进行保存;/n将预先设定的上载速率的作为通道选择阈值,从所述计算结果中,选择符合所述通道选择阈值的通道,作为目标通道,并将所述目标通道中的梯度矩阵作为目标梯度矩阵,其中,所述通道对应有所述训练数据的处理生成后的梯度矩阵;/n选择参数非零的所述目标梯度矩阵,作为服务器的权重;/n根据所述服务器的权重,对所述本地模型进行更新,得到更新后的本地...

【技术特征摘要】
1.一种基于联邦学习的用户数据分类方法,其特征在于,包括:
获取训练数据,通过所述训练数据训练本地模型,并基于每个训练循环期间所述本地模型的权重矩阵的变化梯度,生成梯度矩阵;
计算所述梯度矩阵的通道的欧几里得范数,得到计算结果,并将所述计算结果以张量的形式进行保存;
将预先设定的上载速率的作为通道选择阈值,从所述计算结果中,选择符合所述通道选择阈值的通道,作为目标通道,并将所述目标通道中的梯度矩阵作为目标梯度矩阵,其中,所述通道对应有所述训练数据的处理生成后的梯度矩阵;
选择参数非零的所述目标梯度矩阵,作为服务器的权重;
根据所述服务器的权重,对所述本地模型进行更新,得到更新后的本地模型;
基于所述更新后的本地模型,对用户数据进行分类。


2.根据权利要求1所述的基于联邦学习的用户数据分类方法,其特征在于,所述获取训练数据,通过所述训练数据训练本地模型,并基于每个训练循环期间所述本地模型的权重矩阵的变化梯度,生成梯度矩阵包括:
获取用户数据,并对所述用户数据进行解析,得到本地模型的通用用户,并获取所述通用用户的对应数据,作为所述训练数据;
通过所述训练数据训练本地模型,并基于每个训练循环期间所述本地模型的权重矩阵的变化梯度,生成得到梯度矩阵。


3.根据权利要求1所述的基于联邦学习的用户数据分类方法,其特征在于,所述将预先设定的上载速率的作为通道选择阈值,从所述计算结果中,选择符合所述通道选择阈值的通道,作为目标通道,并将所述目标通道中的梯度矩阵作为目标梯度矩阵包括:
将所述计算结果转化为一阶张量的形式,并将所述计算结果进行排序,得到排序结果;
计算所述预先设定的上载速率的分位数,得到上载速率的分位数;
将所述上载速率的分位数作为通道选择阈值,选择所述排序结果中符合所述通道选择阈值的通道,作为目标通道;
获取所述目标通道中的梯度矩阵,并将所述目标通道中的梯度矩阵作为所述目标梯度矩阵。


4.根据权利要求3所述的基于联邦学习的用户数据分类方法,其特征在于,所述将所述分位数结果作为通道选择阈值,选择所述排序结果中符合所述通道选择阈值的通道,作为目标通道包括:
在所述排序结果中,选择高于所述上载速率的分位数且其他参数为零的通道,作为所述目标通道。


5.根据权利要求1至4任一项所述...

【专利技术属性】
技术研发人员:王健宗肖京何安珣
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1