【技术实现步骤摘要】
数据安全处理方法、装置、计算机设备及存储介质
本专利技术涉及数据安全
,尤其涉及一种数据安全处理方法、装置、计算机设备及存储介质。
技术介绍
近年来,随着信息技术的迅猛发展,大数据的应用越来越广泛,数据共享已成为社会发展的一种趋势。但数据在共享时需要符合特定的条件,保证不能包含个人身份的信息以及可轻易推断出个人隐私信息。如金融保险行业进行数据共享时,根据中国银行业监督管理委员会(简称银监会)和中国保险监督管理委员会(简称中国保监会)等规定,对表示用户身份的信息以及可轻易推断出用户身份的信息需要进行脱敏处理,既保证数据的使用者不能轻易推断出用户的个人隐私信息,又能最大化发挥数据的价值。当前按照规定对用户数据逐一进行脱敏处理,脱敏处理数据量大,不方便操作并且耗时耗力。
技术实现思路
本专利技术实施例提供一种数据安全处理方法、装置、计算机设备及存储介质,以解决用户数据脱敏处理数据量大,不方便操作并且耗时耗力的问题。一种数据安全处理方法,包括:获取数据处理请求,所述数据处理请求包括目标组合特征;根据所述目标组合特征,从用户数据库中获取待测用户数据;根据数据安全处理模型确定目标噪声抽取范围,基于所述目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据;将所述有效用户数据输入到所述数据安全处理模型中,获取所述有效用户数据对应的目标组合特征的输出值;当所述目标组合特征的输出值在预设监测范围内,则将所述有效用户数据作为安全用户数据。一种数据安全处理装置,包括:数据处理请求获取模块,用于获取数据处理请求,所述数据处理请求包括目标组合特征;待测用户数据获取模块,用于根据 ...
【技术保护点】
1.一种数据安全处理方法,其特征在于,包括:获取数据处理请求,所述数据处理请求包括目标组合特征;根据所述目标组合特征,从用户数据库中获取待测用户数据;根据数据安全处理模型确定目标噪声抽取范围,基于所述目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据;将所述有效用户数据输入到所述数据安全处理模型中,获取所述有效用户数据对应的目标组合特征的输出值;当所述目标组合特征的输出值在预设监测范围内,则将所述有效用户数据作为安全用户数据。
【技术特征摘要】
1.一种数据安全处理方法,其特征在于,包括:获取数据处理请求,所述数据处理请求包括目标组合特征;根据所述目标组合特征,从用户数据库中获取待测用户数据;根据数据安全处理模型确定目标噪声抽取范围,基于所述目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据;将所述有效用户数据输入到所述数据安全处理模型中,获取所述有效用户数据对应的目标组合特征的输出值;当所述目标组合特征的输出值在预设监测范围内,则将所述有效用户数据作为安全用户数据。2.如权利要求1所述的数据安全处理方法,其特征在于,所述基于所述目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据,包括:基于所述目标噪声抽取范围,从用户数据库选取非目标组合特征对应的用户数据作为目标噪声数据;将所述目标噪声数据加入到待测用户数据中,获取有效用户数据。3.如权利要求1所述的数据安全处理方法,其特征在于,在所述根据数据安全处理模型确定目标噪声抽取范围的步骤之前,所述数据安全处理方法还包括:获取待训练数据,将所述待训练数据划分为训练集和测试集;初始化原始梯度提升决策树模型的模型参数,所述模型参数包括梯度提升决策树的最大深度和最大迭代次数;将训练集对应的待训练数据输入到所述原始梯度提升决策树模型中,当所述原始梯度提升决策树模型中的训练深度达到所述最大深度且迭代次数达到最大迭代次数,则停止训练所述原始梯度提升决策树模型,获取所述原始梯度提升决策树模型中每个决策树路径对应的原始组合特征;将所述原始组合特征输入到原始逻辑回归模型中,获取所述原始组合特征对应的输出值;当所述原始组合特征对应的输出值在所述预设监测范围内,则将所述原始梯度提升决策树模型和所述原始逻辑回归模型作为目标梯度提升决策树模型和目标逻辑回归模型;采用测试集对应的待训练数据对所述目标梯度提升决策树模型和所述目标逻辑回归模型进行测试,若获取到的每一所述待训练数据对应的输出值均在所述预设监测范围内,则将所述目标梯度提升决策树模型和目标逻辑回归模型作为数据安全处理模型。4.如权利要求3所述的数据安全处理方法,其特征在于,所述获取待训练数据,将所述待训练数据划分为训练集和测试集,包括:获取模型训练请求,所述模型训练请求包括训练组合特征;根据所述训练组合特征,从用户数据库中选取与所述训练组合特征匹配的训练用户数据和与所述训练组合特征不匹配的非训练用户数据;按照预设的正样本数量,从所述训练用户数据中选取对应的训练用户数据作为原始正样本;按照正负样本比例,从所述非训练用户数据中选取对应的非训练用户数据作为原始负样本;根据第一噪声抽取范围从原始正样本中抽取负噪声数据,并将所述负噪声数据加入到原始负样本中,生成有效负样本;根据第二噪声抽取范围从原始负样本中抽取正噪声数据,并将所述正噪声数据加入到原始正样本中,生成有效正样本;将所述有效正样本和所述有效负样本作为待训练数据存储在样本数据库中。5.如权利要求4所述的数据安全处理方法,其特征在于,在所述将所述原始组合特征输入到原始逻辑回归模型中,获取所述原始组合特征对应的输出值的步骤之后,所述数据安全处理方法还包括:当所述原始组合特征对应的输出值低于所述预设监测范围,则减小所述第一噪声抽取范围和所述第二噪声抽取范围,并提高所述正负样本比例;当所述原始组合特征对应的输出值高于所述预设监测范围,则增大所述第一噪声抽取范围和所述第二噪声抽取范围,并降低所述正负样本比例。6.一种数据...
【专利技术属性】
技术研发人员:史光辉,王涵,王建明,肖京,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。