一种模型训练方法、设备及计算机可读存储介质技术

技术编号:25951595 阅读:20 留言:0更新日期:2020-10-17 03:43
本申请实施例提供了一种模型训练方法、设备及计算机可读存储介质;方法包括:获取第一目标样本和第二目标样本;基于第二目标样本,对第一目标样本和第二目标样本的公共样本进行混合,得到混合公共样本;对公共样本和混合公共样本分别进行解密,得到目标样本和目标混合样本;将目标混合样本发送至第二设备,以使第二设备基于目标混合样本与第一设备协同进行模型训练以确定第二模型参数;基于目标样本与第二设备协同进行模型训练,确定第一模型参数,从而完成预测模型的训练,第一模型参数用于与第二模型参数结合完成预测模型的预测任务。通过本申请实施例,能够提升模型训练过程中的数据安全性。

【技术实现步骤摘要】
一种模型训练方法、设备及计算机可读存储介质
本申请涉及人工智能领域的联邦学习技术,尤其涉及一种模型训练方法、装置、设备及计算机可读存储介质。
技术介绍
随着人工智能技术的发展,使用人工智能技术来执行各种预测任务的行业也越来越多,例如金融行业、社交媒体行业等。在利用人工智能进行任务预测时,通常是先用样本数据训练出预测模型,然后基于预测模型来进行任务预测。针对训练数据中隐私性较强的数据,则可以使用联邦学习来完成训练。一般来说,在使用联邦学习训练预测模型时,通常是利用隐私求交技术使各参与方均能够获得数据交集,进而各参与方基于数据交集进行中间参数交互和本地计算,以使各参与方获得自身的模型参数,进而结合各参与方对应的模型参数获得预测模型。然而,上述获取预测模型的过程中,在某个参与方中每条数据都具有隐私性的情况下,使其他参与方获得交集数据对该参与方就构成了数据安全隐患。因此,模型训练过程中的数据安全性较低。
技术实现思路
本申请实施例提供一种模型训练方法、设备及计算机可读存储介质,能够提升基于模型训练过程中的数据安全性。本申请实施例的技术方案是这样实现的:本申请实施例提供一种模型训练方法,包括:获取第一目标样本和第二目标样本,所述第一目标样本为第一设备和第二设备依次对所述第一设备中的金融样本进行加密得到的,所述第二目标样本为所述第二设备和所述第一设备依次对所述第二设备中的社交样本进行加密得到的;基于所述第二目标样本,对所述第一目标样本和所述第二目标样本的公共样本进行混合,得到混合公共样本;对所述公共样本和所述混合公共样本分别进行解密,得到目标样本和目标混合样本;将所述目标混合样本发送至所述第二设备,以使所述第二设备基于所述目标混合样本与所述第一设备协同进行模型训练以确定第二模型参数;基于所述目标样本与所述第二设备协同进行模型训练,确定第一模型参数,从而完成预测模型的训练,所述第一模型参数用于与所述第二模型参数结合完成所述预测模型的预测任务。在本申请实施例中,所述获取第一目标样本和第二目标样本,包括:对第一样本进行加密,得到第一加密样本,所述第一样本为所述第一设备中的金融样本;向所述第二设备发送第一加密样本;接收所述第二设备发送的第二加密样本,所述第二加密样本为所述第二设备对所述第二设备中的第二样本进行加密得到的;对所述第二加密样本进行加密,得到第二目标样本;接收所述第二设备针对所述第一加密样本发送的第一目标样本,所述第一目标样本为所述第二设备对所述第一加密样本进行加密得到的。在本申请实施例中,所述获取所述目标预测信息与所述目标标签信息之间的差异,得到目标差异之后,所述方法还包括:对所述目标差异进行加密,得到加密目标差异;将所述加密目标差异发送至所述第二设备;接收所述第二设备针对所述加密目标差异发送的待解密梯度,所述待解密梯度为所述第二设备利用所述加密目标差异计算得到的加密梯度;对所述待解密梯度进行解密,得到目标梯度;将所述目标梯度发送至所述第二设备,以使所述第二设备利用所述目标梯度进行模型训练确定所述第二模型参数。本申请实施例还提供一种模型训练方法,包括:接收第一设备发送的目标混合样本,所述目标混合样本为所述第一设备基于第二目标样本对第一目标样本和所述第二目标样本的公共样本混合得到的;其中,所述第一目标样本为所述第一设备和第二设备依次对所述第一设备中的金融样本进行加密得到的,所述第二目标样本为所述第二设备和所述第一设备依次对所述第二设备中的社交样本进行加密得到的,所述公共样本用于所述第一设备与所述第二设备协同进行模型训练以确定第一模型参数;基于所述目标混合样本与所述第一设备协同进行模型训练,确定第二模型参数,从而完成预测模型的训练,所述第二模型参数用于与所述第一模型参数结合完成所述预测模型的预测任务。在本申请实施例中,所述接收第一设备发送的目标混合样本之前,所述方法还包括:对第二样本进行加密,得到第二加密样本,所述第二样本为所述第二设备中的社交样本;向所述第一设备发送所述第二加密样本;接收所述第一设备发送的第一加密样本,所述第一加密样本为所述第一设备对所述第一设备中的第一样本进行加密得到的;对所述第一加密样本进行加密,得到所述第一目标样本;将所述第一目标样本发送至所述第一设备,以使所述第一设备基于所述第一目标样本和所述第二加密样本获得所述公共样本。在本申请实施例中,所述将所述第二目标样本发送至所述第一设备之后,所述方法还包括:接收所述第一设备发送的针对所述第二加密样本和所述第一目标样本所发送的所述公共样本和所述混合公共样本;对所述公共样本和所述混合公共样本分别进行解密,得到待解密公共样本和待解密混合公共样本;将所述待解密公共样本和所述待解密混合公共样本发送至所述第一设备,以使所述第一设备对所述待解密公共样本和所述待解密混合公共样本分别进行解密而得到所述目标样本和所述目标混合样本。在本申请实施例中,所述基于所述目标混合样本与所述第一设备协同进行模型训练,确定第二模型参数,包括:从预定特征库中,获取所述目标混合样本对应的第二目标特征,利用第二预设参数,获取所述第二目标特征对应的第二预测信息;将所述第二预测信息发送至所述第一设备,以使所述第一设备基于所述第二预测信息获得加密目标差异;接收所述第一设备发送的加密目标差异,利用所述加密目标差异与所述第二目标特征计算梯度,并对计算得到的梯度进行加密,得到待解密梯度;将所述待解密梯度发送至所述第一设备,以使所述第一设备对所述待解密梯度进行解密而得到目标梯度;接收所述第一设备发送的所述目标梯度,对所述目标梯度进行解密,得到待处理梯度,利用所述待处理梯度对所述第二预设参数进行迭代训练,直到满足预设训练截止条件时,将迭代后的第二预设参数确定为所述第二模型参数。在本申请实施例中,所述基于所述目标混合样本进行模型训练,确定第二模型参数,从而完成预测模型的训练之后,所述方法还包括:接收所述第一设备发送的包括待预测数据的预测请求;响应所述预测请求,利用所述第二模型参数获取待预测数据对应的第二子预测结果;将所述第二子预测结果发送至所述第一设备,以使所述第一设备基于所述第二子预测结果获得所述预测任务对应的目标结果。本申请实施例提供一种模型训练装置,包括:样本获取模块,用于获取第一目标样本和第二目标样本,所述第一目标样本为第一设备和第二设备依次对所述第一设备中的金融样本进行加密得到的,所述第二目标样本为所述第二设备和所述第一设备依次对所述第二设备中的社交样本进行加密得到的;公共样本模块,用于基于所述第二目标样本,对所述第一目标样本和所述第二目标样本的公共样本进行混合,得到混合公共样本;第一解密模块,用于对所述公共样本和所述混合公共样本分别进行解密,本文档来自技高网...

【技术保护点】
1.一种模型训练方法,其特征在于,包括:/n获取第一目标样本和第二目标样本,所述第一目标样本为第一设备和第二设备依次对所述第一设备中的金融样本进行加密得到的,所述第二目标样本为所述第二设备和所述第一设备依次对所述第二设备中的社交样本进行加密得到的;/n基于所述第二目标样本,对所述第一目标样本和所述第二目标样本的公共样本进行混合,得到混合公共样本;/n对所述公共样本和所述混合公共样本分别进行解密,得到目标样本和目标混合样本;/n将所述目标混合样本发送至所述第二设备,以使所述第二设备基于所述目标混合样本与所述第一设备协同进行模型训练以确定第二模型参数;/n基于所述目标样本与所述第二设备协同进行模型训练,确定第一模型参数,从而完成预测模型的训练,所述第一模型参数用于与所述第二模型参数结合完成所述预测模型的预测任务。/n

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
获取第一目标样本和第二目标样本,所述第一目标样本为第一设备和第二设备依次对所述第一设备中的金融样本进行加密得到的,所述第二目标样本为所述第二设备和所述第一设备依次对所述第二设备中的社交样本进行加密得到的;
基于所述第二目标样本,对所述第一目标样本和所述第二目标样本的公共样本进行混合,得到混合公共样本;
对所述公共样本和所述混合公共样本分别进行解密,得到目标样本和目标混合样本;
将所述目标混合样本发送至所述第二设备,以使所述第二设备基于所述目标混合样本与所述第一设备协同进行模型训练以确定第二模型参数;
基于所述目标样本与所述第二设备协同进行模型训练,确定第一模型参数,从而完成预测模型的训练,所述第一模型参数用于与所述第二模型参数结合完成所述预测模型的预测任务。


2.根据权利要求1所述的方法,其特征在于,所述基于所述第二目标样本,对所述第一目标样本和所述第二目标样本的公共样本进行混合,得到混合公共样本,包括:
获取所述第一目标样本和所述第二目标样本的所述公共样本的样本数量;
获取所述第二目标样本的样本数量;
计算所述公共样本的样本数量和所述第二目标样本的样本数量的比值,得到目标比值;
结合所述目标比值与预设样本选择参数,从所述第二目标样本中选择包含所述公共样本的样本,得到所述混合公共样本,从而完成所述第二目标样本对所述公共样本的混合。


3.根据权利要求1或2所述的方法,其特征在于,所述对所述公共样本和所述混合公共样本分别进行解密,得到目标样本和目标混合样本,包括:
将所述公共样本和所述混合公共样本发送至所述第二设备,以使所述第二设备对所述公共样本和所述混合公共样本分别进行解密;
接收所述第二设备针对所述公共样本和所述混合公共样本所发送的待解密公共样本和待解密混合公共样本;
其中,所述待解密公共样本和所述待解密混合公共样本,为所述第二设备对所述公共样本和所述混合公共样本分别进行解密得到的;
对所述待解密公共样本和所述待解密混合公共样本分别进行解密,得到所述目标样本和所述目标混合样本。


4.根据权利要求1或2所述的方法,其特征在于,所述基于所述目标样本与所述第二设备协同进行模型训练,确定第一模型参数,包括:
从预设特征库中,获取与所述目标样本对应的第一目标特征,从预设标签库中,获取与所述目标样本对应的目标标签信息;
利用第一预设参数,获取所述第一目标特征对应的第一预测信息;
接收所述第二设备发送的第二预测信息,所述第二预测信息为所述第二设备利用第二预设参数对所述目标混合样本对应的第二目标特征进行预测得到的结果;
整合所述第一预测信息和所述第二预测信息,得到目标预测信息;
根据所述目标预测信息与所述目标标签信息之间的差异,以及预设差异...

【专利技术属性】
技术研发人员:刘洋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1