一种联邦学习的异常处理方法、装置及电子设备制造方法及图纸

技术编号：28296779 阅读：12 留言：0更新日期：2021-04-30 16:21

本说明书实施例提供一种联邦学习的异常处理方法、装置及电子设备。方法包括：基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与目标联邦学习时的通信记录，确定第一目标成员对象与所述第二目标成员对象之间的通信特征序列。将第一目标成员对象与第二目标成员对象之间的通信特征序列输入至异常识别模型，得到第一目标成员对象与第二目标成员对象的异常识别结果，异常识别模型是基于样本数据和预先为样本数据标注的异常分类标签训练得到的，样本数据包括联邦学习的训练过程中的第一样本成员对象与第二样本成员对象之间的通信特征序列。对第一目标成员对象和/或第二目标成员对象执行与异常识别结果相匹配的风控决策。

全部详细技术资料下载

【技术实现步骤摘要】
一种联邦学习的异常处理方法、装置及电子设备本文件是“一种联邦学习的异常处理方法、装置及电子设备”的分案申请，母案的申请号为“202010047742.5”，申请日为“2020-01-16”。
本文件涉及人工智能
，尤其涉及一种联邦学习的异常处理方法、装置及电子设备。
技术介绍
联邦学习能够在保护机构私有数据隐私的基础上，实现机构之间联合建模，从而解决样本数据割裂的问题。目前，联邦学习系统在引入大量机构进行联合训练时，没有办法识别出训练作恶的成员对象，导致联邦学习模型的正确性无法得到保障。
技术实现思路
本说明书实施例目的是提供一种联邦学习的异常处理方法、装置及电子设备，能够识别出联邦学习训练过程中异常的成员对象(例如作恶成员对象)，并采取相应的风控措施进行处理。为了实现上述目的，本说明书实施例是这样实现的：第一方面，提供一种联邦学习的异常处理方法，包括：基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录，确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列；将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型，得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果，其中，所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的，所述样本数据包括联邦学习的训练过程中的所述第一样本成员对象与所述第二样本成员对象之间的通信特征序列；>对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。第二方面，提供一种联邦学习的异常处理装置，包括：特征确定模块，基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录，确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列；异常识别模块，将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型，得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果，其中，所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的，所述样本数据包括联邦学习的训练过程中的所述第一样本成员对象与所述第二样本成员对象之间的通信特征序列；风控决策模块，对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。第三方面，提供一种电子设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行：基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录，确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列；将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型，得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果，其中，所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的，所述样本数据包括联邦学习的训练过程中的所述第一样本成员对象与所述第二样本成员对象之间的通信特征序列；对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下步骤：基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录，确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列；将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型，得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果，其中，所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的，所述样本数据包括联邦学习的训练过程中的所述第一样本成员对象与所述第二样本成员对象之间的通信特征序列；对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。本说明书实施例的方案利用深度学习模型，通过联邦学习训练过程中成员对象之间的通信特征序列，识别出发起远程控制的异常成员对象，从而对异常成员对象采取相应的风控措施，以保护联邦学习的训练不受破坏。在这种保护机制下，能够放心地引入更多的机构参与到联邦学习中来，可提高联邦学习的实用性和通用性。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书实施例中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图1为联邦学习的示意图。图2为本说明书实施例提供的联邦学习的异常处理方法的流程示意图。图3为本说明书实施例提供的联邦学习的异常处理装置的结构示意图。图4为本说明书实施例提供的电子设备的结构示意图。具体实施方式为了使本
的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。联邦学习系统在引入不同机构进行训练的同时，也给一些恶意机构提供了攻击机会。这些恶意机构在参与到联邦学习的训练过程中，会故意提供错误的中间参数，以破坏模型的正确性。为此，本文件旨在提供一种能够识别出联邦学习的异常成员对象(包含作恶成员对象)，并采取相应的风控措施进行处理的技术方案。为更方便理解本文件的方案，下面对联邦学习进行简单介绍。参考图1，假设机构A和机构B联合训练一个机器学习模型，它们的业务系统分别拥有各自用户的相关数据。此外，机构B还拥有模型需要预测的标签数据。出于数据隐私保护和安全考虑，A和B无法直接进行数据交换，可使用联邦学习模型。其中，联邦学习包括：第一部分：(加密)样本对齐。由于两家企业的用户群体并非完全重合，系统利用基于加密的用户样本对齐技术，在A和B不公开各自数据的前提下确认双方的共有用户，并且不暴露不互相重叠的用户，以便联合这些用户的特征进行建模。第二部分：加密模型训练。在确定共有用户群体后，就可以利用这些数据训练机器学习模型。为了保证训练过程中数据的保密性，需要借助第三方的服务端C进行加密训练。以线性回归模型为例，训练过程可分为以下4步：第①步：服务端C把公钥分发给A和B，用以对训练过程中需要交换的数据进行加密。第②步：A和B之本文档来自技高网...

【技术保护点】
1.一种联邦学习的异常处理方法，包括：/n基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录，确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列；/n将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型，得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果，其中，所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的，所述样本数据包括联邦学习的训练过程中的所述第一样本成员对象与所述第二样本成员对象之间的通信特征序列；/n对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。/n

【技术特征摘要】
1.一种联邦学习的异常处理方法，包括：
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录，确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列；
将所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列输入至异常识别模型，得到所述第一目标成员对象与所述第二目标成员对象的异常识别结果，其中，所述异常识别模型是基于样本数据和预先为所述样本数据标注的异常分类标签训练得到的，所述样本数据包括联邦学习的训练过程中的所述第一样本成员对象与所述第二样本成员对象之间的通信特征序列；
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策。

2.根据权利要求1所述的方法，
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录，确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列，包括：
基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的单位时段的通信记录，确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列；
其中，所述样本数据包括第一样本成员对象在远程控制第二样本成员时，与所述第二样本成员对象之间的单位时段的通信特征序列。

3.根据权利要求2所述的方法，
所述单位时段包括24小时、12小时、1小时中的任一者。

4.根据权利要求1或2中任一项所述的方法，
所述异常识别模型包括具有至少一种通信特征维度的第二异常识别模型，基于目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录，确定所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列，包括：
基于所述第二异常识别模型具有的至少一种通信特征维度，对目标联邦学习的第一目标成员对象与所述目标联邦学习的第二目标成员对象在参与所述目标联邦学习时的通信记录进行特征提取，得到所述第一目标成员对象与所述第二目标成员对象之间的通信特征序列。

5.根据权利要求1或2中任一项所述的方法，
对所述第一目标成员对象和/或所述第二目标成员对象执行与所述异常识别结果相匹配的风控决策，包括：
若异常识别结果指示所述第一目标成员对象和所述第二目标成员对象具有异常行为，则对所述第一目标成员对象和/或所述第二目标成员对象执行以下至少一者：
降低在目标联邦学习的信任值，其中，所述目标联邦学习的成员对象的信任值与成员对象在所述目标联邦学习中的赋能策略相关联；
取消参与目标联邦学习的资格。

6.根据权利要求1或2中任一项所述的方法，
所述第一目标成员对象与所述第二目标成员对象在参与所述目标联邦学习时的通信记录是从第一目标成员对象和/或第二目标成员对象的网络流量日志中提取得到的。

7.根据权利要求1所述的方法，

【专利技术属性】
技术研发人员：刘磊，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人