【技术实现步骤摘要】
用于预测信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于预测信息的方法和装置。
技术介绍
数据隔离和孤岛效应严重制约人工智能发展。不同机构拥有的数据维度和样本数量有限。由于数据安全性和个人信息保护等法律限制,不同机构的数据不能交换或共享,导致机构基于自身的数据和样本建立的模型效果较差,泛化能力弱,且不具备可复制性。例如,金融机构拥有用户的存款、账户交易流水、贷款金额和消费记录等数据,但缺少用户浏览网站的行为和兴趣标签;互联网机构拥有用户的网站浏览行为、兴趣标签和地理位置信息,但缺少金融机构拥有的金融数据。
技术实现思路
本申请实施例提出了用于预测信息的方法和装置。第一方面,本申请实施例提供了一种用于预测信息的方法,包括:获取用户的特征;将用户的特征分别输入至预先训练的第一模型和第二模型,得到用户的第一预测结果和第二预测结果,其中,第一模型和第二模型分别对应不同类别的机构,且基于各自对应的训练样本采用纵向联邦学习方法训练得到;汇总第一预测结果和第二预测结果,生成用户的预测结果。在一些实施例中,第一模型和第二模型通过如下步骤训练:获取第一模型对应的第一训练样本和第二模型对应的第二训练样本,其中,第一训练样本包括第一样本用户的第一样本特征和第一样本标签,第二训练样本包括第二样本用户的第二样本特征;基于第一训练样本和第二训练样本采用纵向联邦学习方法对第一模型和第二模型进行训练。在一些实施例中,基于第一训练样本和第二训练样本采用纵向联邦学习方法对第一模型和第二模型进行训练,包括:获取第一模型的当前梯度值和第二模型的当前梯度值;对第一模型的当前梯度值和第二模 ...
【技术保护点】
1.一种用于预测信息的方法,包括:获取用户的特征;将所述用户的特征分别输入至预先训练的第一模型和第二模型,得到所述用户的第一预测结果和第二预测结果,其中,所述第一模型和所述第二模型分别对应不同类别的机构,且基于各自对应的训练样本采用纵向联邦学习方法训练得到;汇总所述第一预测结果和所述第二预测结果,生成所述用户的预测结果。
【技术特征摘要】
1.一种用于预测信息的方法,包括:获取用户的特征;将所述用户的特征分别输入至预先训练的第一模型和第二模型,得到所述用户的第一预测结果和第二预测结果,其中,所述第一模型和所述第二模型分别对应不同类别的机构,且基于各自对应的训练样本采用纵向联邦学习方法训练得到;汇总所述第一预测结果和所述第二预测结果,生成所述用户的预测结果。2.根据权利要求1所述的方法,其中,所述第一模型和所述第二模型通过如下步骤训练:获取所述第一模型对应的第一训练样本和所述第二模型对应的第二训练样本,其中,所述第一训练样本包括第一样本用户的第一样本特征和第一样本标签,所述第二训练样本包括第二样本用户的第二样本特征;基于所述第一训练样本和所述第二训练样本采用纵向联邦学习方法对所述第一模型和所述第二模型进行训练。3.根据权利要求2所述的方法,其中,所述基于所述第一训练样本和所述第二训练样本采用纵向联邦学习方法对所述第一模型和所述第二模型进行训练,包括:获取所述第一模型的当前梯度值和所述第二模型的当前梯度值;对所述第一模型的当前梯度值和所述第二模型的当前梯度值进行公钥加密,得到所述第一模型的当前公钥加密梯度值和所述第二模型的当前公钥加密梯度值;汇总所述第一模型的当前公钥加密梯度值和所述第二模型的当前公钥加密梯度值,得到当前公钥加密梯度值;对所述当前公钥加密梯度值进行私钥解密,得到当前私钥解密梯度值;基于所述当前私钥解密梯度值分别更新所述第一模型和所述第二模型。4.根据权利要求3所述的方法,其中,所述基于所述第一训练样本和所述第二训练样本采用纵向联邦学习方法对所述第一模型和所述第二模型进行训练,还包括:获取所述第一模型的当前中间值和所述第二模型的当前中间值;对所述第一模型的当前中间值和所述第二模型的当前中间值进行公钥加密,得到所述第一模型的当前公钥加密中间值和所述第二模型的当前公钥加密中间值;基于所述第二模型的当前公钥加密中间值训练所述第一模型,以及基于所述第一模型的当前公钥加密中间值训练所述第二模型。5.根据权利要求4所述的方法,其中,所述基于所述第一训练样本和所述第二训练样本采用纵向联邦学习方法对所述第一模型和所述第二模型进行训练,还包括:获取所述第一模型的当前损失值;对所述第一模型的当前损失值进行公钥加密,得到所述第一模型的当前公钥加密损失值;以及所述汇总所述第一模型的当前公钥加密梯度值和所述第二模型的当前公钥加密梯度值,得到当前公钥加密梯度值,包括:对所述第一模型的当前公钥加密损失值进行私钥解密,得到所述第一模型的当前私钥解密损失值;基于所述第一模型的当前私钥解密损失值汇总所述第一模型的当前公钥加密梯度值和所述第二模型的当前公钥加密梯度值,得到当前公钥加密梯度值。6.根据权利要求3所述的方法,其中,在所述基于所述当前私钥解密梯度值分别更新所述第一模型和所述第二模型之后,还包括:获取所述第一模型的当前损失值和所述第二模型的当前损失值;确定所述第一模型的当前损失值和所述第二模型的当前损失值是否收敛;若所述第一模型的当前损失值和所述第二模型的当前损失值收敛,确定所述第一模型和所述第二模型训练完成。7.根据权利要求6所述的方法,其中,在所述确定所述第一模型的当前损失值和所述第二模型的当前损...
【专利技术属性】
技术研发人员:刘昊骋,许韩晨玺,陈浩,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。