一种模型训练方法、设备及计算机可读存储介质技术

技术编号：25951595 阅读：20 留言：0更新日期：2020-10-17 03:43

本申请实施例提供了一种模型训练方法、设备及计算机可读存储介质；方法包括：获取第一目标样本和第二目标样本；基于第二目标样本，对第一目标样本和第二目标样本的公共样本进行混合，得到混合公共样本；对公共样本和混合公共样本分别进行解密，得到目标样本和目标混合样本；将目标混合样本发送至第二设备，以使第二设备基于目标混合样本与第一设备协同进行模型训练以确定第二模型参数；基于目标样本与第二设备协同进行模型训练，确定第一模型参数，从而完成预测模型的训练，第一模型参数用于与第二模型参数结合完成预测模型的预测任务。通过本申请实施例，能够提升模型训练过程中的数据安全性。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练方法、设备及计算机可读存储介质
本申请涉及人工智能领域的联邦学习技术，尤其涉及一种模型训练方法、装置、设备及计算机可读存储介质。
技术介绍
随着人工智能技术的发展，使用人工智能技术来执行各种预测任务的行业也越来越多，例如金融行业、社交媒体行业等。在利用人工智能进行任务预测时，通常是先用样本数据训练出预测模型，然后基于预测模型来进行任务预测。针对训练数据中隐私性较强的数据，则可以使用联邦学习来完成训练。一般来说，在使用联邦学习训练预测模型时，通常是利用隐私求交技术使各参与方均能够获得数据交集，进而各参与方基于数据交集进行中间参数交互和本地计算，以使各参与方获得自身的模型参数，进而结合各参与方对应的模型参数获得预测模型。然而，上述获取预测模型的过程中，在某个参与方中每条数据都具有隐私性的情况下，使其他参与方获得交集数据对该参与方就构成了数据安全隐患。因此，模型训练过程中的数据安全性较低。
技术实现思路
本申请实施例提供一种模型训练方法、设备及计算机可读存储介质，能够提升基于模型训练过程中的数据安全性。本申请实施例的技术方案是这样实现的：本申请实施例提供一种模型训练方法，包括：获取第一目标样本和第二目标样本，所述第一目标样本为第一设备和第二设备依次对所述第一设备中的金融样本进行加密得到的，所述第二目标样本为所述第二设备和所述第一设备依次对所述第二设备中的社交样本进行加密得到的；基于所述第二目标样本，对所述第一目标样本和所述第二目标样本的公共样本进行混合...

【技术保护点】
1.一种模型训练方法，其特征在于，包括：/n获取第一目标样本和第二目标样本，所述第一目标样本为第一设备和第二设备依次对所述第一设备中的金融样本进行加密得到的，所述第二目标样本为所述第二设备和所述第一设备依次对所述第二设备中的社交样本进行加密得到的；/n基于所述第二目标样本，对所述第一目标样本和所述第二目标样本的公共样本进行混合，得到混合公共样本；/n对所述公共样本和所述混合公共样本分别进行解密，得到目标样本和目标混合样本；/n将所述目标混合样本发送至所述第二设备，以使所述第二设备基于所述目标混合样本与所述第一设备协同进行模型训练以确定第二模型参数；/n基于所述目标样本与所述第二设备协同进行模型训练，确定第一模型参数，从而完成预测模型的训练，所述第一模型参数用于与所述第二模型参数结合完成所述预测模型的预测任务。/n

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：
获取第一目标样本和第二目标样本，所述第一目标样本为第一设备和第二设备依次对所述第一设备中的金融样本进行加密得到的，所述第二目标样本为所述第二设备和所述第一设备依次对所述第二设备中的社交样本进行加密得到的；
基于所述第二目标样本，对所述第一目标样本和所述第二目标样本的公共样本进行混合，得到混合公共样本；
对所述公共样本和所述混合公共样本分别进行解密，得到目标样本和目标混合样本；
将所述目标混合样本发送至所述第二设备，以使所述第二设备基于所述目标混合样本与所述第一设备协同进行模型训练以确定第二模型参数；
基于所述目标样本与所述第二设备协同进行模型训练，确定第一模型参数，从而完成预测模型的训练，所述第一模型参数用于与所述第二模型参数结合完成所述预测模型的预测任务。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第二目标样本，对所述第一目标样本和所述第二目标样本的公共样本进行混合，得到混合公共样本，包括：
获取所述第一目标样本和所述第二目标样本的所述公共样本的样本数量；
获取所述第二目标样本的样本数量；
计算所述公共样本的样本数量和所述第二目标样本的样本数量的比值，得到目标比值；
结合所述目标比值与预设样本选择参数，从所述第二目标样本中选择包含所述公共样本的样本，得到所述混合公共样本，从而完成所述第二目标样本对所述公共样本的混合。

3.根据权利要求1或2所述的方法，其特征在于，所述对所述公共样本和所述混合公共样本分别进行解密，得到目标样本和目标混合样本，包括：
将所述公共样本和所述混合公共样本发送至所述第二设备，以使所述第二设备对所述公共样本和所述混合公共样本分别进行解密；
接收所述第二设备针对所述公共样本和所述混合公共样本所发送的待解密公共样本和待解密混合公共样本；
其中，所述待解密公共样本和所述待解密混合公共样本，为所述第二设备对所述公共样本和所述混合公共样本分别进行解密得到的；
对所述待解密公共样本和所述待解密混合公共样本分别进行解密，得到所述目标样本和所述目标混合样本。

4.根据权利要求1或2所述的方法，其特征在于，所述基于所述目标样本与所述第二设备协同进行模型训练，确定第一模型参数，包括：
从预设特征库中，获取与所述目标样本对应的第一目标特征，从预设标签库中，获取与所述目标样本对应的目标标签信息；
利用第一预设参数，获取所述第一目标特征对应的第一预测信息；
接收所述第二设备发送的第二预测信息，所述第二预测信息为所述第二设备利用第二预设参数对所述目标混合样本对应的第二目标特征进行预测得到的结果；
整合所述第一预测信息和所述第二预测信息，得到目标预测信息；
根据所述目标预测信息与所述目标标签信息之间的差异，以及预设差异...

【专利技术属性】
技术研发人员：刘洋，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人