用于隐私保护的模型微调方法以及风险控制方法技术

技术编号:37973841 阅读:49 留言:0更新日期:2023-06-30 09:49
本发明专利技术公开了一种用于隐私保护的模型微调方法,包括:将自适应模块嵌入特征提取网络中,得到自适应模型;采用第一数据对所述自适应模型进行预训练,并在预训练过程中对所述自适应模块以外的自适应模型参数进行更新,以得到预训练模型;将所述预训练模型下发至用户端,以使用户端能够采用第二数据对所述预训练模型进行训练,并在训练过程中对所述自适应模块的参数进行更新,直至预训练模型收敛,得到用户端推理模型。采用该用户端推理模型可以获得个性化的用户信息,实现个性化学习过程中的风险控制。相应地,本发明专利技术还公开了用于隐私保护的风险控制方法。护的风险控制方法。护的风险控制方法。

【技术实现步骤摘要】
用于隐私保护的模型微调方法以及风险控制方法


[0001]本专利技术涉及一种用户安全管理方法,尤其涉及一种风险控制方法。

技术介绍

[0002]随着手机支付等技术的普及与发展,用户既希望拥有丰富的用户体验,又希望自身的支付安全有所保障,因此在获取用户个性化信息的过程中,风险控制和安全算法识别的实时性问题在当下手机支付等领域中至关重要。
[0003]端模型指部署在端节点,例如用户的手机、平板电脑等用户设备上,用于用户侧推理的模型,与云模型相比更适合用于解决上述问题,其不仅具备较高的实时性,而且模型参数少,大大降低服务器端的链路压力和计算压力,实现轻量级工作。但轻量级的端模型在泛化能力上有所不足,可以采用个性化学习来实现端模型对不同分布的样本之间的自适应,最常用的个性化学习方法即通过少量的特定用户数据样本在一个预训练的模型上进行微调以实现对用户的个性化表征。
[0004]BitFit方法和LoRa方法是目前常用的两种端模型微调方法。然而,BitFit方法通过不修改预训练模型中参数的权重而只修改偏置实现微调,但同时丧失了预训练模型的部分泛化能力,且模型参数量少,很难拥有一个较好的表征搜索空间,也无法对用户样本进行保护;而LoRa方法通过建立旁路编解码网络进行微调,拥有较好的表征搜索空间,但由于样本不足,存在预训练模型无法充分训练甚至过拟合的问题,端模型的性能得不到保证。
[0005]鉴于此,希望获得一种新的用于隐私保护的模型微调方法,使用户样本的数量、端模型的泛化能力和计算开销三种因素获得平衡,同时能够有效防止用户数据的泄露。

技术实现思路

[0006]本专利技术的目的之一在于提供一种用于隐私保护的模型微调方法,该方法能够实现用户端模型的轻量化,在减轻模型训练与使用过程中的计算压力的同时赋予模型较强的泛化能力,并在使用过程中能降低用户数据泄露的风险,使得用户端模型可以安全而高效地对用户进行个性化学习,以利于对用户隐私进行保护。
[0007]基于上述专利技术目的,本专利技术提出了一种用于隐私保护的模型微调方法,应用于服务器端,包括:
[0008]将自适应模块嵌入特征提取网络中,得到自适应模型;
[0009]采用第一数据对所述自适应模型进行预训练,并在预训练过程中对所述自适应模块以外的自适应模型参数进行更新,以得到预训练模型;
[0010]将所述预训练模型下发至用户端,以使用户端能够采用第二数据对所述预训练模型进行训练,并在训练过程中对所述自适应模块的参数进行更新,直至预训练模型收敛,得到用户端推理模型。
[0011]本专利技术在嵌入自适应模块后,在预训练阶段更新自适应模块以外的,即原特征提取网络的参数,并在用户端训练时针对自适应模块的参数进行更新,从而完成对端推理模
型的微调,既节省了大量计算资源,又保证了端推理模型的泛化能力,解决过拟合的问题,并且在个性化学习的同时有效保护了用户的隐私。
[0012]进一步地,所述将自适应模块嵌入特征提取网络中的步骤包括:
[0013]基于线性层或卷积层构建所述自适应模块,将所述自适应模块嵌入特征提取网络中。
[0014]更进一步地,所述基于线性层或卷积层构建所述自适应模块的步骤包括:
[0015]基于卷积层构建CaSE模块,以作为所述自适应模块;所述CaSE模块包括卷积层和旁路池化层。
[0016]当然,在其他的实施方式中,也可以采用基于线性层的方式来构建自适应模块。
[0017]进一步地,所述将自适应模块嵌入特征提取网络中的步骤包括:
[0018]将自适应模块嵌入特征提取网络的中间层之后。
[0019]进一步地,所述将自适应模块嵌入特征提取网络中的步骤包括:
[0020]将所述自适应模块嵌入基于ResNet结构构建的特征提取网络中。
[0021]当然,在其他的实施方式中,也可以将所述自适应模块嵌入现有技术中的其他特征提取网络结构。
[0022]更进一步地,将所述自适应模块嵌入基于ResNet结构构建的特征提取网络中的步骤包括:
[0023]将所述自适应模块嵌入基于ResNet结构构建的特征提取网络的两个相邻卷积层的激活层之后。
[0024]进一步地,所述第一数据至少包括获取自服务器端的大数据。
[0025]基于上述专利技术目的,本专利技术提出了一种用于隐私保护的模型微调方法,应用于用户端,包括:
[0026]接收服务器端下发的所述预训练模型,其中所述预训练模型是服务器端将自适应模块嵌入特征提取网络中得到自适应模型,再采用第一数据对所述自适应模型进行预训练,在预训练过程中对所述自适应模块以外的自适应模型参数进行更新而获得的;
[0027]采用第二数据对所述预训练模型进行训练,在训练过程中对所述自适应模块的参数进行更新,直至预训练模型收敛,得到用户端推理模型。
[0028]更进一步地,所述采用第二数据对所述预训练模型进行训练,在训练过程中对所述自适应模块的参数进行更新的步骤包括:
[0029]采用第二数据对所述预训练模型进行训练,在训练过程中仅对所述自适应模块的参数进行更新,将预训练模型的其他参数当作常量。
[0030]本专利技术通过冻结预训练模型中除自适应模块以外的参数实现模型微调,从而可以在用户端本地进行训练,有效降低了计算开销,同时使用户可以获得定制化的体验,提升了端推理模型的精度。
[0031]进一步地,所述采用第二数据对所述预训练模型进行训练的步骤包括:
[0032]采用第二数据对所述预训练模型进行差分隐私训练。
[0033]在本专利技术中,采用差分隐私技术有效保护了用于个性化学习的用户数据,即使端推理模型被窃取,其包含的用户数据也不会泄露,同时还可以抵御模型反转攻击和成员推理攻击。
[0034]更进一步地,所述采用第二数据对所述预训练模型进行差分隐私训练,在训练过程中对所述自适应模块的参数进行更新的步骤包括:
[0035]基于所述第二数据求解逐样本梯度;
[0036]对所述逐样本梯度进行处理,得到处理后的梯度;
[0037]采用所述处理后的梯度对所述预训练模型进行参数更新。
[0038]更进一步地,对所述逐样本梯度进行处理的步骤包括:
[0039]对所述逐样本梯度进行裁剪;
[0040]将裁剪后的逐样本梯度进行求和,并添加噪声,得到所述处理后的梯度。
[0041]进一步地,所述第二数据为获取自用户端的个性数据。
[0042]本专利技术的另一目的在于提供一种用于用户端隐私保护的风险控制方法,该方法能够在保证用户数据安全的环境下学习到用户个性信息,有效控制了风险,获得低计算成本和高效率兼具的个性化学习体验。
[0043]基于上述目的,本专利技术提出了一种用于用户端隐私保护的风险控制方法,包括:
[0044]获取用户端个性数据;
[0045]将所述用户端个性数据输入预先训练好的端推理模型中进行推理,获得个性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于隐私保护的模型微调方法,应用于服务器端,所述方法包括:将自适应模块嵌入特征提取网络中,得到自适应模型;采用第一数据对所述自适应模型进行预训练,并在预训练过程中对所述自适应模块以外的自适应模型参数进行更新,以得到预训练模型;将所述预训练模型下发至用户端,以使用户端能够采用第二数据对所述预训练模型进行训练,并在训练过程中对所述自适应模块的参数进行更新,直至预训练模型收敛,得到用户端推理模型。2.如权利要求1所述的用于隐私保护的模型微调方法,所述将自适应模块嵌入特征提取网络中的步骤包括:基于线性层或卷积层构建所述自适应模块,将所述自适应模块嵌入特征提取网络中。3.如权利要求2所述的用于隐私保护的模型微调方法,所述基于线性层或卷积层构建所述自适应模块的步骤包括:基于卷积层构建CaSE模块,以作为所述自适应模块;所述CaSE模块包括卷积层和旁路池化层。4.如权利要求1所述的用于隐私保护的模型微调方法,所述将自适应模块嵌入特征提取网络中的步骤包括:将自适应模块嵌入特征提取网络的中间层之后。5.如权利要求1所述的用于隐私保护的模型微调方法,所述将自适应模块嵌入特征提取网络中的步骤包括:将所述自适应模块嵌入基于ResNet结构构建的特征提取网络中。6.如权利要求5所述的用于隐私保护的模型微调方法,将所述自适应模块嵌入基于ResNet结构构建的特征提取网络中的步骤包括:将所述自适应模块嵌入基于ResNet结构构建的特征提取网络的两个相邻卷积层的激活层之后。7.如权利要求1所述的用于隐私保护的模型微调方法,所述第一数据至少包括获取自服务器端的大数据。8.一种用于隐私保护的模型微调方法,应用于用户端,所述方法包括:接收服务器端下发的所述预训练模型,其中所述预训练模型是服务器端将自适应模块嵌入特征提取网络中得到自适应模型,再采用第一数据对所述自适应模型进行预训练,在预训练过程中对所述自适应模块以外的自适应模型参数进行更新而获得的;采用第二数据对所述预训练模型进行训练,在训练过程中对所述自适应模块的参数进行更新,直至预训练模型收敛,得到用户端推理模型。9.如权利要求8所述的用于隐私保护的模型微调方法,所述采用第二数据对所述预训练模型进行训练,在训练过程中对所述自适应模块的参数进行更新的步骤包括:采用第二数据对所述预训练模型进行训练,在训练过程中仅对所述自适应模块的参数进行更新,将预训练模型的其他参数当作常量。10.如权利要求8所述的用于隐私保护的模型微调方法,所述采用第二数据对所述预训练模型进行训练的步骤包括:采用第二数据对所述预训练模型进行差分隐私训练。
11.如权利要求10所述的用于隐私保护的模型微调方法,所述采用第二数据对所述预训练模型进行差分隐私训练,在训练过程中对所述自适应模块的参数进行更新的步骤包括:基于所述第二数据求解逐样本梯度;对所述逐样本梯度进行处理,得到处理后的梯度;采用所述处理后的梯度对所述预训练模型进行参数更新。12.如权利要求11所述的用于隐私保护的模型微调方法,对所述逐样本梯度进行处理的步骤包括:对所述逐样本梯度进行裁...

【专利技术属性】
技术研发人员:申书恒张长浩傅欣艺王维强
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1