一种基于机器学习的数据安全交换系统及方法技术方案

技术编号:34043962 阅读:12 留言:0更新日期:2022-07-06 14:09
本发明专利技术涉及机器学习技术领域,尤其涉及一种基于机器学习的数据安全交换系统,系统包括,内设数据存储模块、自主学习模块、数据抓取模块、数据判定模块,数据判定模块用以对请求录入的数据进行安全判断,对于判定合格的数据数据判定模块将请求录入的数据传递至内设数据存储模块,自主学习模块对录入的数据进行机器学习,学习过程中设置有学习等级,不同的学习等级对应不同学习效果。本发明专利技术通过设置学习等级确定不同的学习效果,减小可疑数据的学习效果的影响,增加自主学习的准确性,同时,对于低质量的学习数据设置数据占比,限定低质量数据的录入,减小低等级数据对自主学习的影响。减小低等级数据对自主学习的影响。减小低等级数据对自主学习的影响。

A data security exchange system and method based on machine learning

【技术实现步骤摘要】
一种基于机器学习的数据安全交换系统及方法


[0001]本专利技术涉及机器学习
,尤其涉及一种基于机器学习的数据安全交换系统及方法。

技术介绍

[0002]近年来,机器学习迅速地发展,给人们带来便利的同时,也带来极大的安全隐患.机器学习的安全与隐私问题已经成为其发展的绊脚石,机器学习模型的训练和预测均是基于大量的数据。
[0003]中国专利公开号:CN 108306891 A。提供一种使用待交换数据来执行机器学习的方法、设备和系统。所述设备包括:初次加密数据接收单元,被配置为分别从第一数据提供方接收第一初次加密结果数据和从第二数据提供方接收第二初次加密结果数据;初次加密数据发送单元,被配置为分别将第一初次加密结果数据发送到第二数据提供方和将第二初次加密结果数据发送到第一数据提供方;再次加密数据接收单元,被配置为分别从第一数据提供方接收第二再次加密结果数据和从第二数据提供方接收第一再次加密结果数据;以及机器学习执行单元,被配置为获取机器学习样本,并基于机器学习样本来执行机器学习。当大量影响学习的数据录入时该方法并不能很好的限制数据录入,当录入的数据存有主动引诱学习方向的数据时,并不能对该类数据进行很好的限制。

技术实现思路

[0004]为此,本专利技术提供一种基于机器学习的数据安全交换系统及方法,用以克服现有技术中当录入的数据存有主动引诱学习方向的数据时,并不能对该类数据进行很好的限制的问题。
[0005]为实现上述目的,本专利技术提供一种基于机器学习的数据安全交换系统。
[0006]内设数据存储模块,用以存储进行机器学习的数据,
[0007]自主学习模块,其与所述内设数据存储模块相连,用以对存储的数据进行自主机器学习;
[0008]数据抓取模块,其与外部数据库相连,用以获取外部数据的请求录入信息;
[0009]数据判定模块,其与所述数据抓取模块相连,用以对请求录入的数据进行安全判断,对于判定合格的数据所述数据判定模块将请求录入的数据传递至所述内设数据存储模块,所述自主学习模块对录入的数据进行机器学习,学习过程中设置有学习等级,不同的学习等级对应不同学习效果;
[0010]安全判断包括危险数据信息判断,敏感数据信息判断和解码验证。
[0011]进一步地,所述数据判定模块内设置有危险数据标记信息组A0,所述危险数据标记信息组A0包括:第一危险数据信息A1、第二危险数据信息A2、...第n危险数据信息An,n为正整数;
[0012]所述数据抓取模块与外部数据库相连,当外部数据库存有拟学习数据B0请求录入
内设数据存储模块时,所述数据抓取模块拟学习数据B0进行抓取,并将数据传递至所述数据判定模块,所述数据判定模块对拟学习数据B0进行分析,判断拟学习数据B0是否存有危险数据信息,
[0013]当拟学习数据B0中存有第i危险数据信息Ai时,所述数据判定模块判定拟学习数据B0存在安全风险;
[0014]当拟学习数据B0中不存在任何危险数据标记信息组A0内数据时,所述数据判定模块对拟学习数据B0进行二级风险分析。
[0015]进一步地,所述数据判定模块内设置有敏感标记信息组C0,所述敏感标记信息组C0包括,第一敏感标记C1,第二敏感标记C2,...第m敏感标记Cm,m为正整数;
[0016]所述数据判定模块对拟学习数据B0进行进行二级风险分析,获取拟学习数据B0的敏感标记数量e,数据判定模块根据拟学习数据B0的敏感标记数量e计算拟学习数据B0的危险价值Zb,Zb=e
×
P,其中,P为拟学习数据危险价值计算补偿参数;
[0017]所述数据判定模块内设置有危险价值评价值Zp,数据判定模块将危险价值Zb与危险价值评价值Zp进行对比,
[0018]当Zb≤Zp时,所述数据判定模块判定拟学习数据B0危险价值低;
[0019]当Zb>Zp时,所述数据判定模块判定拟学习数据B0危险价值高,拟学习数据B0存在安全风险。
[0020]进一步地,所述数据判定模块设置有第一预设敏感标记数量评价参数E1,第二预设敏感标记数量评价参数E2,第一预设危险价值计算补偿参数P1,第二预设危险价值计算补偿参数P2,第三预设危险价值计算补偿参数P3,数据判定模块将敏感标记数量e与第一预设敏感标记数量评价参数E1,第二预设敏感标记数量评价参数E2进行对比,
[0021]当e≤E1时,所述数据判定模块将第一预设危险价值计算补偿参数P1作为拟学习数据危险价值计算补偿参数P的数值;
[0022]当E1<e≤E2时,所述数据判定模块将第二预设危险价值计算补偿参数P2作为拟学习数据危险价值计算补偿参数P的数值;
[0023]当e>E2时,所述数据判定模块将第三预设危险价值计算补偿参数P3作为拟学习数据危险价值计算补偿参数P的数值。
[0024]进一步地,对于任一请求录入内设数据存储模块的拟学习数据B0,其自身附带唯一指定信息编码G,所述数据判定模块内设有解码程序,所述数据判定模块判定拟学习数据B0危险价值低时,数据判定模块对信息编码G进行解码,获取拟学习数据B0的请求码gz,数据判定模块对请求码gz进行验证;
[0025]验证成功,所述数据判定模块同意拟学习数据B0录入所述内设数据存储模块,所述自主学习模块对拟学习数据B0进行机械学习;
[0026]验证失败,所述数据判定模块拒绝拟学习数据B0录入所述内设数据存储模块。
[0027]进一步地,当所述数据判定模块对请求码gz验证成功时,所述数据判定模块内根据请求码gz判断拟学习数据B0的学习等级,学习等级包括第一等级S1,第二等级S2,第三等级S3,不同等级确定不同的学习效果;
[0028]当所述数据判定模块判定拟学习数据B0的学习等级为第一等级S1时,所述自主学习模块对拟学习数据B0进行机械学习时,学习效果为1;
[0029]当所述数据判定模块判定拟学习数据B0的学习等级为第二等级S2时,所述自主学习模块对拟学习数据B0进行机械学习时,学习效果为0.6;
[0030]当所述数据判定模块判定拟学习数据B0的学习等级为第三等级S3时,所述自主学习模块对拟学习数据B0进行机械学习时,学习效果为0.3。
[0031]进一步地,所述数据判定模块设置有第二等级数据量占比评价值K2和第三等级数据量占比评价值K3
[0032]当所述数据判定模块判定拟学习数据B0的学习等级为第二等级S2时,所述数据判定模块获取内设数据存储模块中第二等级的数据量占比Z2,并将Z2与第二等级数据量占比评价值K2对比,
[0033]当Z2≤K2时,所述数据判定模块同意拟学习数据B0录入所述内设数据存储模块,所述自主学习模块对拟学习数据B0进行机械学习;
[0034]当Z2>K2时,所述数据判定模块判定内设数据存储模块中第二等级的数据量占比过大,所述数据判定模块拒绝拟学习数据B0录入所述内设数据存储模块。
[0035]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的数据安全交换系统,其特征在于,包括,内设数据存储模块,用以存储进行机器学习的数据,自主学习模块,其与所述内设数据存储模块相连,用以对存储的数据进行自主机器学习;数据抓取模块,其与外部数据库相连,用以获取外部数据的请求录入信息;数据判定模块,其与所述数据抓取模块相连,用以对请求录入的数据进行安全判断,对于判定合格的数据所述数据判定模块将请求录入的数据传递至所述内设数据存储模块,所述自主学习模块对录入的数据进行机器学习,学习过程中设置有学习等级,不同的学习等级对应不同学习效果;安全判断包括危险数据信息判断,敏感数据信息判断和解码验证;在进行数据录入前,判定数据的学习等级,并对内设数据存储模块内存储的数据占比确定是否录入请求数据。2.根据权利要求1所述的基于机器学习的数据安全交换系统,其特征在于,所述数据判定模块内设置有危险数据标记信息组A0,所述危险数据标记信息组A0包括:第一危险数据信息A1、第二危险数据信息A2、...第n危险数据信息An,n为正整数;所述数据抓取模块与外部数据库相连,当外部数据库存有拟学习数据B0请求录入内设数据存储模块时,所述数据抓取模块拟学习数据B0进行抓取,并将数据传递至所述数据判定模块,所述数据判定模块对拟学习数据B0进行分析,判断拟学习数据B0是否存有危险数据信息,当拟学习数据B0中存有第i危险数据信息Ai时,所述数据判定模块判定拟学习数据B0存在安全风险;当拟学习数据B0中不存在任何危险数据标记信息组A0内数据时,所述数据判定模块对拟学习数据B0进行二级风险分析。3.根据权利要求1所述的基于机器学习的数据安全交换系统,其特征在于,所述数据判定模块内设置有敏感标记信息组C0,所述敏感标记信息组C0包括,第一敏感标记C1,第二敏感标记C2,...第m敏感标记Cm,m为正整数;所述数据判定模块对拟学习数据B0进行进行二级风险分析,获取拟学习数据B0的敏感标记数量e,数据判定模块根据拟学习数据B0的敏感标记数量e计算拟学习数据B0的危险价值Zb,Zb=e
×
P,其中,P为拟学习数据危险价值计算补偿参数;所述数据判定模块内设置有危险价值评价值Zp,数据判定模块将危险价值Zb与危险价值评价值Zp进行对比,当Zb≤Zp时,所述数据判定模块判定拟学习数据B0危险价值低;当Zb>Zp时,所述数据判定模块判定拟学习数据B0危险价值高,拟学习数据B0存在安全风险。4.根据权利要求1所述的基于机器学习的数据安全交换系统,其特征在于,所述数据判定模块设置有第一预设敏感标记数量评价参数E1,第二预设敏感标记数量评价参数E2,第一预设危险价值计算补偿参数P1,第二预设危险价值计算补偿参数P2,第三预设危险价值计算补偿参数P3,数据判定模块将敏感标记数量e与第一预设敏感标记数量评价参数E1,第二预设敏感标记数量评价参数E2进行对比,
当e≤E1时,所述数据判定模块将第一预设危险价值计算补偿参数P1作为拟学习数据危险价值计算补偿参数P的数值;当E1<e≤E2时,所述数据判定模块将第二预设危险价值计算补偿参数P2作为拟学习数据危险价值计算补偿参数P的数值;当e>E2时,所述数据判定模块将第三预设危险价值计算补偿参数P3作为拟学习数据危险价值计算补偿参数P的数值。5.根据权利要求4所述的基于机器学习的数据安全交换系统,其特征在于,对于任一请求录入内设数据存储模块的拟学习数据B0,其自身...

【专利技术属性】
技术研发人员:杨莹赵春健
申请(专利权)人:北京国信网联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1