The invention discloses a federated modeling method, device and readable storage medium based on migration learning. The method includes: the first terminal maps the eigenvector of the labeled first sample data into the common optimal space, obtains the first common eigenvector, determines the first gradient value and the first loss value according to the first common eigenvector, and for the first gradient value and the first loss value. Loss-of-value encryption; combining the first gradient value and the first loss value of encryption with the second gradient value and the second loss value of encryption sent by the received second terminal to obtain the third loss value and the third gradient value of encryption; sending the third loss value and the third gradient value of encryption to the third terminal, and determining the third loss value and the historical loss value returned by the third terminal decryption. Whether the model to be trained converges or not; if the model to be trained converges, the model to be trained is established with the parameters of the model at the time of convergence. The invention can improve the privacy and utilization rate of the sample data of each party.
【技术实现步骤摘要】
基于迁移学习的联邦建模方法、设备及可读存储介质
本专利技术涉及机器学习的
,尤其涉及一种基于迁移学习的联邦建模方法、设备及可读存储介质。
技术介绍
随着机器学习的快速发展,机器学习可应用于各个领域,如数据挖掘、计算机视觉、自然语言处理、生物特征识别、医学诊断、检测信用卡欺诈、证券市场分析和DNA序列测序等。机器学习包括学习部分和执行部分,学习部分利用样本数据修改系统的知识库,以增进系统执行部分完成任务的效能,执行部分根据知识库完成任务,同时把获得的信息反馈给学习部分。目前,由于各方的样本数据具有密切联系,如果机器学习仅使用一方的样本数据,则学习得到的模型不准确,为解决上述问题,通过联合各方的样本数据,应用逻辑回归或决策树等单层简单模型进行机器学习。然而,由于需要联合各方的样本数据,存在一方的样本数据被另一方知晓的情况,此外,目前的联合学习主要依托于共同样本数据,而各方的共同样本数据是有限的,使得各方独有的样本数据无法被有效利用。因此,如何提高各方样本数据的私密性和利用率是目前亟待解决的问题。
技术实现思路
本专利技术的主要目的在于提供一种基于迁移学习的联邦建模方 ...
【技术保护点】
1.一种基于迁移学习的联邦建模方法,其特征在于,所述基于迁移学习的联邦建模方法包括以下步骤:第一终端将标注的第一样本数据的特征向量映射至共同最优空间,得到第一共同特征向量,并依据所述第一共同特征向量确定第一梯度值和第一损失值,且对所述第一梯度值和所述第一损失值加密;将加密的第一梯度值和第一损失值,与接收到的所述第二终端发送的加密的第二梯度值和第二损失值结合,得到加密的第三损失值和第三梯度值;将加密的第三损失值和第三梯度值发送至第三终端,并依据所述第三终端解密返回的第三损失值和历史损失值,确定待训练模型是否收敛;若待训练模型收敛,则以收敛时的模型参数,建立待训练模型。
【技术特征摘要】
1.一种基于迁移学习的联邦建模方法,其特征在于,所述基于迁移学习的联邦建模方法包括以下步骤:第一终端将标注的第一样本数据的特征向量映射至共同最优空间,得到第一共同特征向量,并依据所述第一共同特征向量确定第一梯度值和第一损失值,且对所述第一梯度值和所述第一损失值加密;将加密的第一梯度值和第一损失值,与接收到的所述第二终端发送的加密的第二梯度值和第二损失值结合,得到加密的第三损失值和第三梯度值;将加密的第三损失值和第三梯度值发送至第三终端,并依据所述第三终端解密返回的第三损失值和历史损失值,确定待训练模型是否收敛;若待训练模型收敛,则以收敛时的模型参数,建立待训练模型。2.如权利要求1所述的基于迁移学习的联邦建模方法,其特征在于,当所述第三终端接收到所述第一终端发送的加密的第三损失值时,获取所述第一终端前一次发送的加密的历史损失值,并依据预存的私有密钥对加密的第三损失值、历史损失值和第三梯度值进行解密,且将解密后的第三损失值、历史损失值和第三梯度值返回给所述第一终端。3.如权利要求2所述的基于迁移学习的联邦建模方法,其特征在于,依据所述第三终端解密返回的第三损失值和历史损失值,确定待训练模型是否收敛的步骤包括:接收所述第三终端解密返回的第三损失值和历史损失值;计算解密返回的第三损失值和历史损失值之间的差值,并判断所述差值是否小于或等于预设阈值;若所述差值小于或等于预设阈值,则确定待训练模型收敛,否则确定待训练模型不收敛。4.如权利要求1所述的基于迁移学习的联邦建模方法,其特征在于,所述将加密的第一梯度值和第一损失值,与接收到的所述第二终端发送的加密的第二梯度值和第二损失值结合,得到加密的第三损失值和第三梯度值的步骤之后,还包括:所述第二终端将加密的第二梯度值,与接收到的所述第一终端发送的加密的第一梯度值结合,得到加密的第四梯度值,并将加密的第四梯度值发送的所述第三终端;依据所述第三终端解密返回的第三损失值和历史损失值,确定待训练模型是否收敛的步骤之后,还包括:若待训练模型未收敛,则向所述第三终端发送梯度更新指令,由所述第三终端依据梯度更新指令对加密的第三梯度值和第四梯度值进行解密,并将解密后的第三梯度值返回至所述第一终端,且将解密后的第四梯度值返回至所述第二终端;所述第一终端依据所述第三终端解密返回的第三梯度值更新所述第一终端的本地梯度,且在更新完成后,返回执行步骤:第一终端将标注的第一样本数据的特征向量...
【专利技术属性】
技术研发人员:刘洋,杨强,成柯葳,范涛,陈天健,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。