一种分类模型训练方法及装置制造方法及图纸

技术编号：32329857 阅读：21 留言：0更新日期：2022-02-16 18:37

本发明专利技术提供了一种分类模型训练方法及装置，其中，该方法包括：从样本数据集中获取基于安全多方秘密共享的有标签参与方的响应变量和无标签参与方的解释变量；根据该有标签参与方的响应变量和该无标签参与方的解释变量构造检验统计量；根据该检验统计量确定该样本数据集的分类模型的分割准则，以完成对该分类模型的训练，可以解决相关技术中联邦学习框架下的联合建模，为了避免信息泄露增加了计算成本且计算速度慢的问题，通过安全多方秘密共享，在实现数据隐私保护的前提下，进行分类模型的训练，实现了保护数据隐私的分类模型构建。实现了保护数据隐私的分类模型构建。实现了保护数据隐私的分类模型构建。

全部详细技术资料下载

【技术实现步骤摘要】
一种分类模型训练方法及装置

[0001]本专利技术涉及数据处理领域，具体而言，涉及一种分类模型训练方法及装置。

技术介绍

[0002]常规用联邦学习框架下的联合建模，变量一般需要进行离散化分箱，并计算woe值，在当前的技术框架下，纵向联邦的联合建模实现，对于无标签方是有可能根据结果反推标签变量的值，造成信息泄露的，这就还需要单独开发一个可以安全、无泄漏的计算模块，会增加计算成本，以及计算速度减慢，造成算法适应有局限性。
[0003]针对相关技术中联邦学习框架下的联合建模，为了避免信息泄露增加了计算成本且计算速度慢的问题，尚未提出解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种分类模型训练方法及装置，以至少解决相关技术中联邦学习框架下的联合建模，为了避免信息泄露增加了计算成本且计算速度慢的问题。
[0005]根据本专利技术的一个实施例，提供了一种分类模型训练方法，包括：
[0006]从样本数据集中获取基于安全多方秘密共享的有标签参与方的响应变量和无标签参与方的解释变量；
[0007]根据所述有标签参与方的响应变量和所述无标签参与方的解释变量构造检验统计量；
[0008]根据所述检验统计量确定所述样本数据集的分类模型的分割准则，以完成对所述分类模型的训练。
[0009]可选地，根据所述检验统计量确定所述样本数据集的分类模型的分割准则，以完成对所述分类模型的训练包括：
[0010]基于置换检验方法，通过所述检验统计量的分布估计确定所述检

【技术保护点】

【技术特征摘要】
1.一种分类模型训练方法，其特征在于，包括：从样本数据集中获取基于安全多方秘密共享的有标签参与方的响应变量和无标签参与方的解释变量；根据所述有标签参与方的响应变量和所述无标签参与方的解释变量构造检验统计量；根据所述检验统计量确定所述样本数据集的分类模型的分割准则，以完成对所述分类模型的训练。2.根据权利要求1所述的方法，其特征在于，根据所述检验统计量确定所述样本数据集的分类模型的分割准则，以完成对所述分类模型的训练包括：基于置换检验方法，通过所述检验统计量的分布估计确定所述检验统计量对应的解释变量的假设校验值；根据所述检验统计量对应的解释变量的假设校验值确定所述分类模型的分类准则，以完成对所述分类模型的训练。3.根据权利要求2所述的方法，其特征在于，根据所述检验统计量对应的解释变量的假设校验值确定所述分类模型的分类准则，以完成对所述分类模型的训练包括：根据所述检验统计量对应的解释变量的假设校验值从所述检验统计量对应的解释变量中选择与响应变量关联性最强的目标解释变量；将所述目标解释变量作为分割点对所述样本数据集进行分割，得到所述分类模型的分类准则，以完成对所述分类模型的训练。4.根据权利要求3所述的方法，其特征在于，根据所述检验统计量对应的解释变量的假设校验值从所述检验统计量对应的解释变量中选择与响应变量最显著的目标解释变量包括：确定所述假设校验值中最小值对应的解释变量为所述目标解释变量。5.根据权利要求2所述的方法，其特征在于，基于置换检验方法，通过所述检验统计量的分布估计确定所述检验统计量对应的解释变量的假设校验值包括：在零假设下对所述检验统计量的分布进行估计，得到所述检验统计量的分布估计；根据所述检验统计量的分布估计确定所述检验统计量对应的解释变量的假设校验值。6.根据权利要求5所述的方法，其特征在于，所述方法还包括：通过以下方式，根据所述检验统计量的分布估计确定所述检验统计量对应的解释变量的假设校验值：其中，P<...

【专利技术属性】
技术研发人员：张明锐，李琨，田江，向小佳，丁永建，李璠，
申请(专利权)人：光大科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人