基于半监督学习的联邦建模方法、设备及可读存储介质技术

技术编号:20242275 阅读:48 留言:0更新日期:2019-01-29 23:19
本发明专利技术公开了一种基于半监督学习的联邦建模方法、设备及可读存储介质,包括:第一终端依据第二终端发送的初始模型参数对样本数据执行标注操作,以将样本数据划分为标注的样本数据和未标注的样本数据;第一终端和第二终端依据各自标注的样本数据对初始化后的待训练模型的模型参数进行联合训练迭代,直至初始化后的待训练模型收敛;依据收敛时的模型参数,对未标注的样本数据执行标注操作,并在标注操作完成之后,计算未标注样本比例,且确定未标注样本比例是否小于或等于预设阈值;若未标注样本比例小于或等于预设阈值,则以当前模型参数建立模型,否则继续执行联合训练迭代和样本标注操作。本发明专利技术能够提高各方样本数据的利用率。

【技术实现步骤摘要】
基于半监督学习的联邦建模方法、设备及可读存储介质
本专利技术涉及联合学习的
,尤其涉及一种基于半监督学习的联邦建模方法、设备及可读存储介质。
技术介绍
随着机器学习的快速发展,机器学习可应用于各个领域,如数据挖掘、计算机视觉、自然语言处理、生物特征识别、医学诊断、检测信用卡欺诈、证券市场分析和DNA序列测序等。机器学习包括学习部分和执行部分,学习部分利用样本数据修改系统的知识库,以增进系统执行部分完成任务的效能,执行部分根据知识库完成任务,同时把获得的信息反馈给学习部分。目前,由于各方的样本数据具有密切联系,如果机器学习仅使用一方的样本数据,则学习得到的模型不准确,为解决上述问题,通过联合各方的样本数据,应用逻辑回归或决策树等单层简单模型进行机器学习。然而,目前的联合学习主要依托于双方均拥有标注的样本数据,无法使用无标注的样本数据进行联合训练,导致样本数据无法得到有效利用。因此,如何提高各方样本数据的的利用率是目前亟待解决的问题。
技术实现思路
本专利技术的主要目的在于提供一种基于半监督学习的联邦建模方法、设备及可读存储介质,旨在提高各方样本数据的的利用率。为实现上述目的,本专利技本文档来自技高网...

【技术保护点】
1.一种基于半监督学习的联邦建模方法,其特征在于,所述基于半监督学习的联邦建模方法包括以下步骤:第一终端接收第二终端发送的初始模型参数,并依据所述初始模型参数对样本数据执行标注操作,以将所述样本数据划分为标注的样本数据和未标注的样本数据,其中,所述初始模型参数由所述第二终端依据存储在所述第二终端中的标注的样本数据对待训练模型进行训练迭代得到;所述第一终端和所述第二终端依据各自标注的样本数据对初始化后的待训练模型的模型参数进行联合训练迭代,直至初始化后的待训练模型收敛;所述第一终端依据收敛时的模型参数,对未标注的样本数据执行标注操作,并在标注操作完成之后,计算未标注样本比例;确定所述未标注样本比...

【技术特征摘要】
1.一种基于半监督学习的联邦建模方法,其特征在于,所述基于半监督学习的联邦建模方法包括以下步骤:第一终端接收第二终端发送的初始模型参数,并依据所述初始模型参数对样本数据执行标注操作,以将所述样本数据划分为标注的样本数据和未标注的样本数据,其中,所述初始模型参数由所述第二终端依据存储在所述第二终端中的标注的样本数据对待训练模型进行训练迭代得到;所述第一终端和所述第二终端依据各自标注的样本数据对初始化后的待训练模型的模型参数进行联合训练迭代,直至初始化后的待训练模型收敛;所述第一终端依据收敛时的模型参数,对未标注的样本数据执行标注操作,并在标注操作完成之后,计算未标注样本比例;确定所述未标注样本比例是否小于或等于预设阈值;若所述未标注样本比例小于或等于预设阈值,则以当前模型参数建立模型,否则执行步骤:所述第一终端和所述第二终端依据各自标注的样本数据对初始化后的待训练模型的模型参数进行联合训练迭代,直至初始化后的待训练模型收敛。2.如权利要求1所述的基于半监督学习的联邦建模方法,其特征在于,依据所述初始模型参数对样本数据执行标注操作的步骤包括:依据所述初始模型参数对样本数据进行预测,得到样本预测结果;依据所述样本预测结果,对所述样本数据执行标注操作。3.如权利要求1所述的基于半监督学习的联邦建模方法,其特征在于,所述计算未标注样本比例的步骤包括:统计所述样本数据中未标记的本地样本的个数,记为未标注样本数,并统计所述样本数据的总样本数;用所述未标注样本数除以所述总样本数,得到未标注样本比例。4.如权利要求1-3中任一项所述的基于半监督学习的联邦建模方法,其特征在于,所述第一终端和所述第二终端依据各自标注的样本数据对初始化后的待训练模型的模型参数进行联合训练迭代,直至初始化后的待训练模型收敛的步骤包括:所述第一终端依据存储在所述第一终端本地的标注的样本数据对初始化后的待训练模型的模型参数进行训练迭代,得到加密的第一损失值和第一梯度值;接收所述第二终端发送的加密的第二损失值和第二梯度值,其中,所述第二终端依据存储在所述第二终端本地的标注的样本数据对初始化后的待训练模型的模型参数进行训练迭代,得到加密的第二损失值和第二梯度值;依据加密的第一损失值和第二损失值,计算加密的第三损失值,并依据加密的第一梯度值和第二梯度值,计算加密的第三梯度值;将加密的第三损失值和第三梯度值传输至第三终端,其中,所述第三终端对加密的第三损失值和第三梯度值进行解密,并依据解密的第三损失值,确定...

【专利技术属性】
技术研发人员:刘洋杨强陈天健范涛成柯葳
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1