敏感数据监测方法、系统、电子设备及存储介质技术方案

技术编号:39298590 阅读:10 留言:0更新日期:2023-11-07 11:07
本申请涉及数据安全技术领域,提供一种敏感数据监测方法、系统、电子设备及存储介质。方法包括:数据提供者向数据分发器发送数据监测请求消息;数据分发器将数据监测请求消息发送至敏感数据监测实例;由数据处理器接收数据监测请求消息,对原始数据进行采样,向敏感嗅探器发送涉敏查询请求消息;数据处理器基于涉敏查询结果,向涉敏处理器发送涉敏处理请求消息;涉敏处理器输出涉敏查询结果;数据处理器将数据处理结果传输至数据使用者;数据分发器向数据提供者返回数据监测响应消息。本申请实施例提供的敏感数据监测方法,通过采用人工智能技术自动学习敏感数据关键特征,适用于多种类型的数据监测,具有效率高和准确率高的特点。点。点。

【技术实现步骤摘要】
敏感数据监测方法、系统、电子设备及存储介质


[0001]本申请涉及数据安全
,具体涉及一种敏感数据监测方法、系统、电子设备及存储介质。

技术介绍

[0002]目前,针对敏感数据监测方法主要包括基于规则的敏感数据监测和基于日志的敏感数据审计两大类,两种方法都是依靠业务专家经验识别敏感数据,不同之处在于,基于规则的敏感数据监测将业务专家经验线上化,把具体规则固化在IT系统中;而基于日志的敏感数据审计依靠业务专家线下分析,对数据传输内容进行逐一人工审核。
[0003]由于上述两种方案均过于依靠于人工的专家经验,缺乏对监测对象和监测环境的主动学习和更新,因此存在诸多缺陷。从监测对象上来看,基于规则的敏感数据监测的应用范围狭窄,对数据内容进行黑名单过滤,导致该方法只适合监测文本类数据是否涉敏,而对于图片、视频、音频等非文本类数据是否涉敏识别,基于规则的敏感数据监测不再适用。从监测能力上来看,现有敏感数据监测技术缺乏标准化、自动学习和快速迭代能力,基于规则的敏感数据监测和基于日志的敏感数据审计技术都是依靠业务专家经验判断,这导致现有数据敏感监测技术缺乏标准化、客观化;同时,对于业务专家熟悉领域范围外的数据监测任务,现有敏感数据监测技术无能为力,识别能力也无法针对新类型数据进行自动更新,快速升级。从监测效果上来看,现有敏感数据监测技术未能充分监测数据内容,开展协调、立体、有序的监测模式,而是通过人工配置静态规则,简单、独立、无序地叠加,无法达到综合监测效果,基于规则的敏感数据监测存在规则错配置、漏配置的可能性,人工维护工作量巨大,甚至存在通过SQL临时表、敏感字段重命名、数据格式转换存储等技术手段绕开基于规则的敏感数据监测的可能性,使得现有敏感数据监测手段失效。
[0004]针对敏感数据监测方法存在的多种局限性,需要提出一种新的敏感数据监测方法。

技术实现思路

[0005]本申请实施例提供一种敏感数据监测方法、系统、电子设备及存储介质,用以解决敏感数据监测的现有方法普遍存在过于依赖人工监测经验,监测效率低以及无法快速学习升级以适应新场景的技术问题。
[0006]第一方面,本申请实施例提供一种敏感数据监测方法,包括:
[0007]数据提供者向数据分发器发送数据监测请求消息,请求监测传输的原始数据是否为敏感数据;
[0008]所述数据分发器基于实例状态运行表,将所述数据监测请求消息发送至负荷最低的敏感数据监测实例,启动响应计时器;
[0009]由数据处理器接收所述数据监测请求消息,分批次缓存原始数据,基于预设采样策略对所述原始数据进行采样,向敏感嗅探器发送涉敏查询请求消息;
[0010]所述敏感嗅探器部署模型生成器生成的敏感数据监测人工智能AI模型,向所述数据处理器返回涉敏查询响应消息;
[0011]所述数据处理器基于所述涉敏查询结果,向涉敏处理器发送涉敏处理请求消息;
[0012]所述涉敏处理器根据所述涉敏查询响应消息中的涉敏标记判断所述原始数据是否为敏感数据,输出涉敏查询结果;
[0013]所述数据处理器基于所述涉敏查询结果执行相应的数据处理动作,将数据处理结果传输至数据使用者,并通过异步消息处理机制向所述数据分发器返回数据处理响应消息;
[0014]所述数据分发器向所述数据提供者返回数据监测响应消息,所述数据监测响应消息用于表示所述原始数据是否传输至所述数据使用者。
[0015]在一个实施例中,所述数据提供者向数据分发器发送数据监测请求消息,请求监测传输的原始数据是否为敏感数据,之前还包括:
[0016]所述模型生成器向主用数据分发器发送查询实例地址请求,获取所有敏感数据监测实例地址;
[0017]所述数据分发器基于所述实例状态运行表,获取所述所有敏感数据监测实例地址,向所述模型生成器回复实例地址消息;
[0018]所述模型生成器基于实例地址清单,将生成的所述敏感数据监测AI模型发送至各个敏感数据监测实例;
[0019]所述各个敏感数据监测实例在所述敏感嗅探器上部署模型文件并对所述模型文件进行测试校验,待所述敏感数据监测AI模型完成部署,向所述模型生成器返回确认模型文件消息;
[0020]所述模型生成器向所述数据分发器同步各个敏感数据监测实例运行状态,完成敏感数据监测AI模型更新。
[0021]在一个实施例中,所述敏感数据监测AI模型,通过以下步骤获得:
[0022]获取训练数据样本,基于有监督学习的二分类算法,人工配置所述训练数据样本,标记为敏感数据正样本,采用对抗生成网络处理所述训练数据样本,标记为不敏感数据负样本;
[0023]确定深度学习神经网络初始模型,分别在模型训练态采用所述敏感数据正样本和所述不敏感数据负样本对所述深度学习神经网络初始模型进行训练,以及在模型推理态采用所述原始数据对所述深度学习神经网络初始模型进行训练,得到所述敏感数据监测AI模型;
[0024]其中所述模型训练态部署于所述模型生成器,所述模型推理态部署于所述敏感嗅探器。
[0025]在一个实施例中,所述在模型训练态采用所述敏感数据正样本和所述不敏感数据负样本对所述深度学习神经网络初始模型进行训练,包括:
[0026]在输入层将所述敏感数据正样本和所述不敏感数据负样本转换为多组数值特征向量;
[0027]在隐藏层利用深度学习神经网络初始模型学习固定长度或可变长度的数据特征,基于样本标签采用反向传播算法更新模型参数;
[0028]在输出层通过Softmax算法实现所述训练数据样本的二分类输出,判断所述训练数据样本是否为敏感数据。
[0029]在一个实施例中,所述在模型推理态采用所述原始数据对所述深度学习神经网络初始模型进行训练,包括:
[0030]在输入层将所述原始数据转换为多组数值特征向量;
[0031]在隐藏层基于所述模型参数,计算所述原始数据是否为敏感数据;
[0032]在输出层通过Softmax算法实现预测数据的二分类输出,判断所述预测数据是否为敏感数据。
[0033]在一个实施例中,还包括:
[0034]各个敏感数据监测实例的所述敏感嗅探器向主用数据分发器周期性发送心跳信息,所述主用数据分发器基于所述心跳信息更新所述主用数据分发器上的实例运行状态表;
[0035]所述敏感嗅探器基于所述异步消息处理机制向备用数据分发器发送所述心跳信息;
[0036]所述主用数据分发器周期性向所述备用数据分发器发起数据同步,更新所述备用数据分发器上的实例运行状态表;
[0037]所述主用数据分发器周期性向所述备用数据分发器发送所述心跳消息,若所述备用数据分发器在预设时长内未收到所述心跳消息,则切换为主用数据分发器。
[0038]第二方面,本申请实施例提供一种敏感数据监测系统,包括:
[0039]模型生成器、敏感嗅探器、数据分发器、数据处理器和涉敏处理器,其中:
[0040]所述模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种敏感数据监测方法,其特征在于,包括:数据提供者向数据分发器发送数据监测请求消息,请求监测传输的原始数据是否为敏感数据;所述数据分发器基于实例状态运行表,将所述数据监测请求消息发送至负荷最低的敏感数据监测实例,启动响应计时器;由数据处理器接收所述数据监测请求消息,分批次缓存原始数据,基于预设采样策略对所述原始数据进行采样,向敏感嗅探器发送涉敏查询请求消息;所述敏感嗅探器部署模型生成器生成的敏感数据监测人工智能AI模型,向所述数据处理器返回涉敏查询响应消息;所述数据处理器基于所述涉敏查询结果,向涉敏处理器发送涉敏处理请求消息;所述涉敏处理器根据所述涉敏查询响应消息中的涉敏标记判断所述原始数据是否为敏感数据,输出涉敏查询结果;所述数据处理器基于所述涉敏查询结果执行相应的数据处理动作,将数据处理结果传输至数据使用者,并通过异步消息处理机制向所述数据分发器返回数据处理响应消息;所述数据分发器向所述数据提供者返回数据监测响应消息,所述数据监测响应消息用于表示所述原始数据是否传输至所述数据使用者。2.根据权利要求1所述的敏感数据监测方法,其特征在于,所述数据提供者向数据分发器发送数据监测请求消息,请求监测传输的原始数据是否为敏感数据,之前还包括:所述模型生成器向主用数据分发器发送查询实例地址请求,获取所有敏感数据监测实例地址;所述数据分发器基于所述实例状态运行表,获取所述所有敏感数据监测实例地址,向所述模型生成器回复实例地址消息;所述模型生成器基于实例地址清单,将生成的所述敏感数据监测AI模型发送至各个敏感数据监测实例;所述各个敏感数据监测实例在所述敏感嗅探器上部署模型文件并对所述模型文件进行测试校验,待所述敏感数据监测AI模型完成部署,向所述模型生成器返回确认模型文件消息;所述模型生成器向所述数据分发器同步各个敏感数据监测实例运行状态,完成敏感数据监测AI模型更新。3.根据权利要求2所述的敏感数据监测方法,其特征在于,所述敏感数据监测AI模型,通过以下步骤获得:获取训练数据样本,基于有监督学习的二分类算法,人工配置所述训练数据样本,标记为敏感数据正样本,采用对抗生成网络处理所述训练数据样本,标记为不敏感数据负样本;确定深度学习神经网络初始模型,分别在模型训练态采用所述敏感数据正样本和所述不敏感数据负样本对所述深度学习神经网络初始模型进行训练,以及在模型推理态采用所述原始数据对所述深度学习神经网络初始模型进行训练,得到所述敏感数据监测AI模型;其中所述模型训练态部署于所述模型生成器,所述模型推理态部署于所述敏感嗅探器。4.根据权利要求3所述的敏感数据监测方法,其特征在于,所述在模型训练态采用所述
敏感数据正样本和所述不敏感数据负样本对所述深度学习神经网络初始模型进行训练,包括:在输入层将所述敏感数据正样本和所述不敏感数据负样本转换为多组数值特征向量;在隐藏层利用深度学习神经网络初始模型学习固定长度或可变长度的数据特征,基于样本标签采用反向传播算法更新模型参数;在输出层通过Softmax算法实现所述训练数据样本的二分类输出,判断所述训练数据样本是否为敏感数据。5.根据权利要求3所述的敏感数据监测方法,其特征在于,所述在模型推理态采用所述原始数据对所述深度学习神经网络初始模型进行训练,包括:在输入层将所述原始数据转换为多组数值特征向量;在隐藏层基于所述模型参数,计算所述原始数据是否为敏感数据;在输出层通过Softmax算法实现预测数据的二分类输出,判断所述预测数据是否为敏感数据。6.根据权利要求1所述的敏感数据监测方法,其特征在于,还包括:各...

【专利技术属性】
技术研发人员:薛飞陈贞贞陈彬梁猛
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1