基于大数据传输场景的明文信息下线方法及其相关设备技术

技术编号:39308449 阅读:10 留言:0更新日期:2023-11-12 15:55
本申请实施例属于金融科技技术领域,涉及一种基于大数据传输场景的明文信息下线方法及其相关设备,包括通过agent服务,埋点采集用户发起SQL访问时所需的目标访问数据;获取各个业务系统分别所涉及的敏感数据;传递到预设的日志收集系统内,进行缓存;再获取并传递至目标存储地址,并进行分表存储,获得第一表单和第二表单;关联第一表单和所述第二表单,分析、统计在预设的单元时间内用户发起SQL访问时,分别访问密文数据和明文数据的次数信息;根据分别访问密文数据和明文数据的次数信息和预设的访问比例阈值,判断是否对目标数据进行下线处理。通过引入agent服务,实现了大数据传输场景下的明文数据安全下线,降低了业务系统生产事故的发生。统生产事故的发生。统生产事故的发生。

【技术实现步骤摘要】
基于大数据传输场景的明文信息下线方法及其相关设备


[0001]本申请涉及金融科技
,尤其涉及一种基于大数据传输场景的明文信息下线方法及其相关设备。

技术介绍

[0002][0003]随着金融科技行业的发展,以保险行业为例,随着保险行业业务条线增多,业务系统复杂度也逐渐增强,涉及的敏感信息也渐渐增多,加密方式只能通过平滑过渡,具体到底层表结构即明文字段、明文字段+密文字段、密文字段,而明文信息的删除条件为用户SQL已不再访问明文字段。业务SQL的访问量每天达百亿,RMDBS无法基于如此大数据量进行用户SQL访问统计,如果贸然下线明文信息,线上业务系统事故风险极大。因此,现有技术进行明文数据下线时,还存在盲目下线和易造成业务系统产生生产事故的问题。

技术实现思路

[0004]本申请实施例的目的在于提出一种基于大数据传输场景的明文信息下线方法及其相关设备,以解决现有技术进行明文数据下线时,还存在盲目下线和易造成业务系统产生生产事故的问题。
[0005]为了解决上述技术问题,本申请实施例提供一种基于大数据传输场景的明文信息下线方法,采用了如下所述的技术方案:
[0006]一种基于大数据传输场景的明文信息下线方法,包括下述步骤:
[0007]通过预先在各个业务系统后端嵌入的agent服务,埋点采集用户发起SQL访问时所需的目标访问数据,作为一类数据,其中,所述目标访问数据包括明文数据或/和密文数据,所述agent服务由预设的日志收集系统提供;
[0008]获取各个业务系统分别所涉及的敏感数据,作为二类数据,其中,所述敏感数据为键值对格式数据,每一条所述敏感数据由一条明文数据和其对应的密文数据组成;
[0009]将所述一类数据和所述二类数据传递到所述预设的日志收集系统内,进行缓存,其中,所述预设的日志收集系统为Flume系统;
[0010]获取并传递所述一类数据和所述二类数据至目标存储地址,并将所述一类数据和所述二类数据进行分表存储,获得第一表单和第二表单;
[0011]关联所述第一表单和所述第二表单,并根据关联结果,统计在预设的单元时间内用户发起SQL访问时,分别访问目标明文数据的明文访问次数及访问所述目标明文数据对应密文数据的密文访问次数;
[0012]计算所述明文访问次数与所述密文访问次数间的比值,若所述比值小于所述预设的访问比例阈值,则对所述目标明文数据进行下线处理。
[0013]进一步的,所述agent服务包括数据源获取节点,在执行所述通过预先在各个业务系统后端嵌入的agent服务,埋点采集用户发起SQL访问时所需的目标访问数据的步骤之
前,所述方法还包括:
[0014]获取预设配置的Kafka分布式消息获取节点,其中,所述Kafka分布式消息获取节点一一嵌入各个业务系统后端,并通过所述Kafka分布式消息获取节点向各个业务系统后端提供目标访问数据采集服务;
[0015]设置所述Kafka分布式消息获取节点为所述agent服务的数据源获取节点,或者,设置所述Kafka分布式消息获取节点作为与所述agent服务的数据源获取节点具备数据传输关系的在先获取节点;
[0016]所述通过预先在各个业务系统后端嵌入的agent服务,埋点采集用户发起SQL访问时所需的目标访问数据的步骤,具体包括:
[0017]启用所述agent服务的数据源获取节点;
[0018]调用基于所述Kafka分布式消息获取节点提供的目标访问数据采集服务;
[0019]根据所述目标访问数据采集服务分别采集各个业务系统的用户发起SQL访问时所需的目标访问数据;
[0020]将采集到的各个业务系统的用户发起SQL访问时所需的目标访问数据传递给所述agent服务的数据源获取节点,完成对所述目标访问数据的采集。
[0021]进一步的,在执行所述获取各个业务系统分别所涉及的敏感数据的步骤之前,所述方法还包括:
[0022]构建所述Kafka分布式消息获取节点与预设的安全控制端间的端口连接关系;
[0023]通过所述Kafka分布式消息获取节点,向所述预设的安全控制端提供敏感数据接收服务,其中,所述预设的安全控制端提供将各个业务系统分别所涉及的敏感数据发送至指定目标接收端的服务;
[0024]所述获取各个业务系统分别所涉及的敏感数据的步骤,具体包括:
[0025]启用所述agent服务的数据源获取节点;
[0026]调用基于所述Kafka分布式消息获取节点提供的敏感数据接收服务;
[0027]根据所述敏感数据接收服务接收由所述安全控制端发送的各个业务系统分别所涉及的敏感数据;
[0028]将接收到的由所述安全控制端发送的各个业务系统分别所涉及的敏感数据传递给所述agent服务的数据源获取节点,完成对所述敏感数据的获取。
[0029]进一步的,所述agent服务还包括短暂缓存节点,所述将所述一类数据和所述二类数据传递到所述预设的日志收集系统内,进行缓存的步骤,具体包括:
[0030]通过所述agent服务的数据源获取节点,将采集到的各个业务系统的用户发起SQL访问时所需的目标访问数据,
[0031]和接收到的由所述安全控制端发送的各个业务系统分别所涉及的敏感数据传递给所述短暂缓存节点,进行短暂缓存。
[0032]进一步的,所述agent服务还包括长期存储节点,所述获取并传递所述一类数据和所述二类数据至目标存储地址的步骤,具体包括:
[0033]获取预先配置于预设的HDFS分布式文件系统内的所述长期存储节点;
[0034]根据所述长期存储节点的配置信息,获取所述长期存储节点在所述HDFS分布式文件系统内对应的文件缓存路径;
[0035]基于所述文件缓存路径将所述采集到的各个业务系统的用户发起SQL访问时所需的目标访问数据,和接收到的由所述安全控制端发送的各个业务系统分别所涉及的敏感数据传递至所述长期存储节点。
[0036]进一步的,所述将所述一类数据和所述二类数据进行分表存储,获得第一表单和第二表单的步骤,具体包括:
[0037]获取预先为所述目标访问数据和所述敏感数据所分别构建的Hive表及各个Hive表的入库地址;
[0038]根据各个Hive表的入库地址,将所述目标访问数据和所述敏感数据存入到相应的目标Hive表内,获得第一表单和第二表单,其中,所述第一表单和所述第二表单分别存储所述目标访问数据和所述敏感数据,所述第一表单和所述第二表单中都包括访问时间字段信息和访问次数字段信息。
[0039]进一步的,所述统计在预设的单元时间内用户发起SQL访问时,分别访问目标明文数据的明文访问次数及访问所述目标明文数据对应密文数据的密文访问次数的步骤,具体包括:
[0040]根据所述第二表单,筛选出所述第一表单中属于敏感数据的密文数据和明文数据;
[0041]根据第一表单的访问时间字段信息和访本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据传输场景的明文信息下线方法,其特征在于,包括下述步骤:通过预先在各个业务系统后端嵌入的agent服务,埋点采集用户发起SQL访问时所需的目标访问数据,作为一类数据,其中,所述目标访问数据包括明文数据或/和密文数据,所述agent服务由预设的日志收集系统提供;获取各个业务系统分别所涉及的敏感数据,作为二类数据,其中,所述敏感数据为键值对格式数据,每一条所述敏感数据由一条明文数据和其对应的密文数据组成;将所述一类数据和所述二类数据传递到所述预设的日志收集系统内,进行缓存,其中,所述预设的日志收集系统为Flume系统;获取并传递所述一类数据和所述二类数据至目标存储地址,并将所述一类数据和所述二类数据进行分表存储,获得第一表单和第二表单;关联所述第一表单和所述第二表单,并根据关联结果,统计在预设的单元时间内用户发起SQL访问时,分别访问目标明文数据的明文访问次数及访问所述目标明文数据对应密文数据的密文访问次数;计算所述明文访问次数与所述密文访问次数间的比值,若所述比值小于所述预设的访问比例阈值,则对所述目标明文数据进行下线处理。2.根据权利要求1所述的基于大数据传输场景的明文信息下线方法,其特征在于,所述agent服务包括数据源获取节点,在执行所述通过预先在各个业务系统后端嵌入的agent服务,埋点采集用户发起SQL访问时所需的目标访问数据的步骤之前,所述方法还包括:获取预设配置的Kafka分布式消息获取节点,其中,所述Kafka分布式消息获取节点一一嵌入各个业务系统后端,并通过所述Kafka分布式消息获取节点向各个业务系统后端提供目标访问数据采集服务;设置所述Kafka分布式消息获取节点为所述agent服务的数据源获取节点,或者,设置所述Kafka分布式消息获取节点作为与所述agent服务的数据源获取节点具备数据传输关系的在先获取节点;所述通过预先在各个业务系统后端嵌入的agent服务,埋点采集用户发起SQL访问时所需的目标访问数据的步骤,具体包括:启用所述agent服务的数据源获取节点;调用基于所述Kafka分布式消息获取节点提供的目标访问数据采集服务;根据所述目标访问数据采集服务分别采集各个业务系统的用户发起SQL访问时所需的目标访问数据;将采集到的各个业务系统的用户发起SQL访问时所需的目标访问数据传递给所述agent服务的数据源获取节点,完成对所述目标访问数据的采集。3.根据权利要求2所述的基于大数据传输场景的明文信息下线方法,其特征在于,在执行所述获取各个业务系统分别所涉及的敏感数据的步骤之前,所述方法还包括:构建所述Kafka分布式消息获取节点与预设的安全控制端间的端口连接关系;通过所述Kafka分布式消息获取节点,向所述预设的安全控制端提供敏感数据接收服务,其中,所述预设的安全控制端提供将各个业务系统分别所涉及的敏感数据发送至指定目标接收端的服务;所述获取各个业务系统分别所涉及的敏感数据的步骤,具体包括:
启用所述agent服务的数据源获取节点;调用基于所述Kafka分布式消息获取节点提供的敏感数据接收服务;根据所述敏感数据接收服务接收由所述安全控制端发送的各个业务系统分别所涉及的敏感数据;将接收到的由所述安全控制端发送的各个业务系统分别所涉及的敏感数据传递给所述agent服务的数据源获取节点,完成对所述敏感数据的获取。4.根据权利要求3所述的基于大数据传输场景的明文信息下线方法,其特征在于,所述agent服务还包括短暂缓存节点,所述将所述一类数据和所述二类数据传递到所述预设的日志收集系统内,进行缓存的步骤,具体包括:通过所述agent服务的数据源获取节点,将采集到的各个业务系统的用户发起SQL访问时所需的目标访问数据,和接收到的由所述安全控制端发送的各个业务系统分别所涉及的敏感数据传递给所述短暂缓存节点,进行短暂缓存。5.根据权利要求3或4所述的基于大数据传输场景的明文信息下线方法,其特征在于,所述agent服务还包括长期存储节点,所述获取并传递所述一类数据...

【专利技术属性】
技术研发人员:解培佩陈奕宇
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1