数据安全处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:20725587 阅读:23 留言:0更新日期:2019-03-30 17:50
本发明专利技术公开了一种数据安全处理方法、装置、计算机设备及存储介质,该方法包括获取数据处理请求,数据处理请求包括目标组合特征;根据目标组合特征,从用户数据库中获取待测用户数据;根据数据安全处理模型确定目标噪声抽取范围,基于目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据;将有效用户数据输入到数据安全处理模型中,获取有效用户数据对应的目标组合特征的输出值;当目标组合特征的输出值在预设监测范围内,则将有效用户数据作为安全用户数据。该方法既保证数据的使用者不能轻易推断出用户的个人隐私信息,又能最大化程度地发挥目标数据的价值。

【技术实现步骤摘要】
数据安全处理方法、装置、计算机设备及存储介质
本专利技术涉及数据安全
,尤其涉及一种数据安全处理方法、装置、计算机设备及存储介质。
技术介绍
近年来,随着信息技术的迅猛发展,大数据的应用越来越广泛,数据共享已成为社会发展的一种趋势。但数据在共享时需要符合特定的条件,保证不能包含个人身份的信息以及可轻易推断出个人隐私信息。如金融保险行业进行数据共享时,根据中国银行业监督管理委员会(简称银监会)和中国保险监督管理委员会(简称中国保监会)等规定,对表示用户身份的信息以及可轻易推断出用户身份的信息需要进行脱敏处理,既保证数据的使用者不能轻易推断出用户的个人隐私信息,又能最大化发挥数据的价值。当前按照规定对用户数据逐一进行脱敏处理,脱敏处理数据量大,不方便操作并且耗时耗力。
技术实现思路
本专利技术实施例提供一种数据安全处理方法、装置、计算机设备及存储介质,以解决用户数据脱敏处理数据量大,不方便操作并且耗时耗力的问题。一种数据安全处理方法,包括:获取数据处理请求,所述数据处理请求包括目标组合特征;根据所述目标组合特征,从用户数据库中获取待测用户数据;根据数据安全处理模型确定目标噪声抽取范围,基于所述目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据;将所述有效用户数据输入到所述数据安全处理模型中,获取所述有效用户数据对应的目标组合特征的输出值;当所述目标组合特征的输出值在预设监测范围内,则将所述有效用户数据作为安全用户数据。一种数据安全处理装置,包括:数据处理请求获取模块,用于获取数据处理请求,所述数据处理请求包括目标组合特征;待测用户数据获取模块,用于根据所述目标组合特征,从用户数据库中获取待测用户数据;有效用户数据获取模块,用于根据数据安全处理模型确定目标噪声抽取范围,基于所述目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据;数据安全处理模块,用于将所述有效用户数据输入到所述数据安全处理模型中,获取所述有效用户数据对应的目标组合特征的输出值;安全用户数据获取模块,用于当所述目标组合特征的输出值在预设监测范围内,则将所述有效用户数据作为安全用户数据。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据安全处理方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述数据安全处理方法的步骤。上述数据安全处理方法、装置、计算机设备及存储介质,通过目标组合特征从用户数据库中获取待测用户数据,然后根据数据安全处理模型确定的目标噪声抽取范围,抽取特定数量的非目标组合特征对应的用户数据加入到待测用户数据中,降低待测用户数据的准确性来保证用户数据的安全性。该目标噪声抽取范围是根据训练好的数据安全处理模型确定的,使得根据目标噪声抽取范围获取的有效用户数据更加准确,满足用户要求,既保证用户数据的安全又能使用户数据发挥数据的价值。获取有效用户数据后,为了进一步确定有效用户数据是否满足要求,还需要将有效用户数据输入到数据安全处理模型中,获取有效用户数据对应的目标组合特征的输出值,当输出值在预设监测范围,则表示有效用户数据满足要求,将有效用户数据作为安全用户数据,以使安全用户数据达到脱敏处理要求,既保证其无法轻易推导出个人私聊信息,又能最大化程度地发挥目标数据的价值。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中数据安全处理方法的一应用场景图;图2是本专利技术一实施例中数据安全处理方法的一流程图;图3是图2中步骤S30的一具体流程图;图4是图2中步骤S30之前的一流程图;图5是图4中步骤S301的一具体流程图;图6是本专利技术一实施例中数据安全处理装置的一示意图;图7是本专利技术一实施例中计算机设备的一示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请提供的数据安全处理方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务器进行通信。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中,如图2所示,提供一种数据安全处理方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:S10:获取数据处理请求,数据处理请求包括目标组合特征。本实施例中的数据处理请求指客户端发送给服务器用于处理用户数据的请求,该数据处理请求包括目标组合特征。该目标组合特征指用户根据需要在客户端填写的关于用户数据的特征,包括但不限于用户数据库中存储的用户的年龄、性别、是否有车、是否购买保险(包括但不限于车险、产险和寿险)等特征。可以理解地,该目标组合特征包括至少一个用户数据的特征。S20:根据目标组合特征,从用户数据库中获取待测用户数据。其中,用户数据库指用于存储用户数据的数据库。本实施例中的用户数据库中存储的用户数据包括但不限于用户的基本信息、购买行为和交易数据。其中,基本信息包括但不限于姓名、年龄(出生年月)、性别、籍贯、民族、教育背景和工作经历等。购买行为指用户在平台购买产品的行为,包括但不限于用户购买的理财产品和保险产品。交易数据指用户的投资、消费和转账的记录数据。具体地,当用户在客户端设置好目标组合特征后,发送给服务器,服务器根据获取到的目标组合特征,从用户数据库中获取与目标组合特征对应的用户数据作为待测用户数据。其中,待测用户数据指需要进行测试的用户数据。S30:根据数据安全处理模型确定目标噪声抽取范围,基于目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据。为了保护用户数据的安全性,本实施例对待测用户数据添加非目标组合特征对应的用户数据,使得获取的有效用户数据不全为目标组合特征对应的用户数据,降低基本信息用户数据的准确性来保证用户数据的安全性。其中,数据安全处理模型指预先训练好的用于确定目标噪声抽取范围的模型。目标噪声抽取范围指用于抽取非目标组合特征对应的用户数据的范围。本实施例中的数据安全处理模型包括目标梯度提升决策树模型和目标逻辑回归模型。目标梯度提升决策树模型指预先训练好的满足用户要求的梯度提升决策树,梯度提升决策树(GradientBoostingDecisionTree,GBDT)是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来作为最终预测结果。目标逻辑回归模型指预先训练好的用于获取目标噪声抽取范围的逻辑回归模型。逻辑回归模型(LogisticRegression,LR)是一种减小预测范围,将预测值限定为[0,1]间的一种回归模型。在获取待测用户数据后,根据安全处理模型确定目标噪声抽取范围,从用户数本文档来自技高网...

【技术保护点】
1.一种数据安全处理方法,其特征在于,包括:获取数据处理请求,所述数据处理请求包括目标组合特征;根据所述目标组合特征,从用户数据库中获取待测用户数据;根据数据安全处理模型确定目标噪声抽取范围,基于所述目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据;将所述有效用户数据输入到所述数据安全处理模型中,获取所述有效用户数据对应的目标组合特征的输出值;当所述目标组合特征的输出值在预设监测范围内,则将所述有效用户数据作为安全用户数据。

【技术特征摘要】
1.一种数据安全处理方法,其特征在于,包括:获取数据处理请求,所述数据处理请求包括目标组合特征;根据所述目标组合特征,从用户数据库中获取待测用户数据;根据数据安全处理模型确定目标噪声抽取范围,基于所述目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据;将所述有效用户数据输入到所述数据安全处理模型中,获取所述有效用户数据对应的目标组合特征的输出值;当所述目标组合特征的输出值在预设监测范围内,则将所述有效用户数据作为安全用户数据。2.如权利要求1所述的数据安全处理方法,其特征在于,所述基于所述目标噪声抽取范围对待测用户数据进行处理,获取有效用户数据,包括:基于所述目标噪声抽取范围,从用户数据库选取非目标组合特征对应的用户数据作为目标噪声数据;将所述目标噪声数据加入到待测用户数据中,获取有效用户数据。3.如权利要求1所述的数据安全处理方法,其特征在于,在所述根据数据安全处理模型确定目标噪声抽取范围的步骤之前,所述数据安全处理方法还包括:获取待训练数据,将所述待训练数据划分为训练集和测试集;初始化原始梯度提升决策树模型的模型参数,所述模型参数包括梯度提升决策树的最大深度和最大迭代次数;将训练集对应的待训练数据输入到所述原始梯度提升决策树模型中,当所述原始梯度提升决策树模型中的训练深度达到所述最大深度且迭代次数达到最大迭代次数,则停止训练所述原始梯度提升决策树模型,获取所述原始梯度提升决策树模型中每个决策树路径对应的原始组合特征;将所述原始组合特征输入到原始逻辑回归模型中,获取所述原始组合特征对应的输出值;当所述原始组合特征对应的输出值在所述预设监测范围内,则将所述原始梯度提升决策树模型和所述原始逻辑回归模型作为目标梯度提升决策树模型和目标逻辑回归模型;采用测试集对应的待训练数据对所述目标梯度提升决策树模型和所述目标逻辑回归模型进行测试,若获取到的每一所述待训练数据对应的输出值均在所述预设监测范围内,则将所述目标梯度提升决策树模型和目标逻辑回归模型作为数据安全处理模型。4.如权利要求3所述的数据安全处理方法,其特征在于,所述获取待训练数据,将所述待训练数据划分为训练集和测试集,包括:获取模型训练请求,所述模型训练请求包括训练组合特征;根据所述训练组合特征,从用户数据库中选取与所述训练组合特征匹配的训练用户数据和与所述训练组合特征不匹配的非训练用户数据;按照预设的正样本数量,从所述训练用户数据中选取对应的训练用户数据作为原始正样本;按照正负样本比例,从所述非训练用户数据中选取对应的非训练用户数据作为原始负样本;根据第一噪声抽取范围从原始正样本中抽取负噪声数据,并将所述负噪声数据加入到原始负样本中,生成有效负样本;根据第二噪声抽取范围从原始负样本中抽取正噪声数据,并将所述正噪声数据加入到原始正样本中,生成有效正样本;将所述有效正样本和所述有效负样本作为待训练数据存储在样本数据库中。5.如权利要求4所述的数据安全处理方法,其特征在于,在所述将所述原始组合特征输入到原始逻辑回归模型中,获取所述原始组合特征对应的输出值的步骤之后,所述数据安全处理方法还包括:当所述原始组合特征对应的输出值低于所述预设监测范围,则减小所述第一噪声抽取范围和所述第二噪声抽取范围,并提高所述正负样本比例;当所述原始组合特征对应的输出值高于所述预设监测范围,则增大所述第一噪声抽取范围和所述第二噪声抽取范围,并降低所述正负样本比例。6.一种数据...

【专利技术属性】
技术研发人员:史光辉王涵王建明肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1