一种数字化信息风险监控方法及装置制造方法及图纸

技术编号:30447620 阅读:13 留言:0更新日期:2021-10-24 18:41
本发明专利技术公开了一种数字化信息风险监控方法,包括获取第一报文数据,将所述第一报文数据进行筛选处理后发送到消息队列;从所述消息队列中获取所述筛选处理后的第一报文数据并进行去重合并处理,得到第二报文数据;利用多模式匹配算法对所述第二报文数据中的敏感数据进行识别,并添加相应敏感标签;将完成所述识别处理后的第二报文数据落库,并进行风险监控。本申请整个过程自动化程度高,具有采集、清洗、识别、展示、告警等一系列功能;各模块通过协同工作和逻辑判断,完成敏感数据发现、告警、处理、验证等的全生命周期管理;并且该装置使用简单,可扩展性强,可适用于应用接口敏感数据识别和数据库敏感数据识别,极大的方便企业信息风险管理。信息风险管理。信息风险管理。

【技术实现步骤摘要】
一种数字化信息风险监控方法及装置


[0001]本专利技术涉及大数据领域,尤其涉及一种数字化信息风险监控方法及装置。

技术介绍

[0002]近年来,数字经济蓬勃发展,企业在推动生产力发展和生产关系变革的同时带来了企业快速发展和新机遇,但同时企业在数字化转型升级过程中也遇到一些信息化、数字化安全风险,如企业数据泄露事件。随着民众对自身隐私和数据安全保护意识逐步提高,数据安全也越来越受到国家以及各界关注,企业一旦发生数据泄露会面临风险:客户资损风险:用户数据泄露其信息会被不法分子利用进行诈骗或盗刷(金融数据),对用户造成资损;舆情危机风险:降低用户信任感,影响公司市场口碑和声誉,促使用户放弃使用产品、增加用户流失率;监管合规风险:带来法律法规风险,甚至是行政或刑事处罚。目前全球各国相继制定和完善数据安全相关法律法规,如欧盟GDPR规定“企业发生数据泄露最高受到当年全球营业额的4%或最高2000万欧元处罚”,而我国在数据安全法规制定方面也日趋和国际接轨。

技术实现思路

[0003]本专利技术提供的一种数字化信息风险监控方法,旨在解决现有技术中对企业数字化信息中的敏感数据处理不够彻底,对于其中报文数据存在重复处理导致效率低,并且数据落库后进行风险监控不及时,不能及时告警而形成闭环的风险处理的问题。
[0004]为实现上述目的,本专利技术采用以下技术方案:获取第一报文数据,将所述第一报文数据进行筛选处理后发送到消息队列,所述筛选处理包括去除所述第一报文数据中静态数据和非法异常数据;从所述消息队列中获取所述筛选处理后的第一报文数据并进行去重合并处理,得到第二报文数据;利用多模式匹配算法对所述第二报文数据中的敏感数据进行识别,并添加相应敏感标签;将完成所述识别处理后的第二报文数据落库,并进行风险监控。
[0005]作为优选,所述获取第一报文数据,将所述第一报文数据进行筛选处理后发送到消息队列,所述筛选处理包括去除所述第一报文数据中静态数据和非法异常数据,包括以下步骤:通过配置脚本和应用接口,采集原始流量数据,所述脚本用于控制采集频率和限制采集的数据内容;将所述原始流量数据按照网络报文格式进行解码获取第一报文数据;根据预设的过滤规则对所述第一报文数据进行筛选过滤并格式化后,通过所述脚本推送到消息队列。
[0006]作为优选,所述从所述消息队列中获取所述筛选处理后的第一报文数据并进行去
重合并处理,得到第二报文数据,包括:从所述消息队列中获取所述筛选处理后的第一报文数据,从中提取关键参数,利用信息摘要算法将所述关键参数顺序拼接加密后生成唯一哈希值;根据所述哈希值进行去重合并处理;作为优选,所述利用多模式匹配算法对所述第二报文数据中的敏感数据进行识别,并添加相应敏感标签,包括:根据预设关键字和预设正则表达式对所述第二报文数据的正文内容进行匹配,当匹配相符时,对所述匹配相符的正文内容添加敏感标签;所述预设关键字表示个人隐私身份数据,所述预设正则表达式表示被用来检索、替换那些符合某个模式的文本。
[0007]作为优选,所述将完成所述识别处理后的第二报文数据落库,并进行风险监控,包括:通过所述哈希值判断第三报文数据是否是新落库的,若数据库中不存在相同的所述哈希值,所述第三报文数据是新落库的,并发起告警推送,以进行风险监控,所述第三报文数据是完成所述识别处理后的第二报文数据落库后得到的;若数据库中存在相同的所述哈希值,则判断是否存在相同的所述敏感标签,若是则设置所述第三报文数据的敏感标签的状态为已修复状态,若否则不进行更新操作;一种数字化信息风险监控装置,包括:获取模块:用于获取第一报文数据,将所述第一报文数据进行筛选处理后发送到消息队列,所述筛选处理包括去除所述第一报文数据中静态数据和非法异常数据;去重模块:用于从所述获取模块的所述消息队列中获取所述筛选处理后的第一报文数据并进行去重合并处理,得到第二报文数据;识别模块:用于利用多模式匹配算法对所述去重模块得到的所述第二报文数据中的敏感数据进行识别,并添加相应敏感标签;监控模块:用于将完成所述识别处理后的第二报文数据落库,并进行风险监控。
[0008]作为优选,所述获取模块具体包括:配置单元:用于通过配置脚本和应用接口,采集原始流量数据,所述脚本用于控制采集频率和限制采集的数据内容;解码单元:用于将所述配置单元得到所述原始流量数据按照网络报文格式进行解码获取第一报文数据;过滤单元:用于根据预设的过滤规则对所述解码单元得到的所述第一报文数据进行筛选过滤并格式化后,通过所述脚本推送到消息队列。
[0009]作为优选,所述去重模块具体包括:加密单元:用于从所述消息队列中获取所述筛选处理后的第一报文数据,从中提取关键参数,利用信息摘要算法将所述关键参数顺序拼接加密后生成唯一哈希值;去重子单元:用于根据所述加密单元得到的所述哈希值进行去重合并处理。
[0010]作为优选,所述识别模块具体包括:匹配单元:用于根据预设关键字和预设正则表达式对所述第二报文数据的正文内容进行匹配,当匹配相符时,对所述匹配相符的正文内容添加敏感标签;所述预设关键字表示个人隐私身份数据,所述预设正则表达式表示被用来检索、替换那些符合某个模式的文
本。
[0011]作为优选,所述监控模块具体包括:第一判断单元:用于通过所述哈希值判断第三报文数据是否是新落库的,若数据库中不存在相同的所述哈希值,所述第三报文数据是新落库的,并发起告警推送,以进行风险监控,所述第三报文数据是完成所述识别处理后的第二报文数据落库后得到的;第二判断单元:若数据库中存在相同的所述哈希值,则判断是否存在相同的所述敏感标签,若是则设置所述第三报文数据的敏感标签的状态为已修复状态,若否则不进行更新操作。
[0012]一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如上述中任一项所述的一种数字化信息风险监控方法。
[0013]一种存储有计算机程序的计算机可读存储介质,所述计算机程序使计算机执行时实现如上述中任一项所述的一种数字化信息风险监控方法。
[0014]本专利技术具有如下有益效果:本申请整个过程自动化程度高,具有采集、清洗、识别、展示、告警等一系列功能;各模块通过协同工作和逻辑判断,完成敏感数据发现、告警、处理、验证等的全生命周期管理;并且该装置使用简单,可扩展性强,可适用于应用接口敏感数据识别和数据库敏感数据识别,极大的方便企业信息风险管理。
附图说明
[0015]图1是本专利技术实施例实现一种数字化信息风险监控方法第一流程图;图2是本专利技术实施例实现一种数字化信息风险监控方法第二流程图;图3是本专利技术实施例实现一种数字化信息风险监控方法第三流程图;图4是本专利技术实施例实现一种数字化信息风险监控方法具体实施流程图;图5是本专利技术实施例实现一种数字化信息风险监控装置示意图;图6是本专利技术实施例实现一种数字化信息风险监控装置的获取模块示意图;图7是本专利技术实施例实现一种数字化信息风险监控装置的去重模块示意图;图8是本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数字化信息风险监控方法,其特征在于,包括:获取第一报文数据,将所述第一报文数据进行筛选处理后发送到消息队列,所述筛选处理包括去除所述第一报文数据中静态数据和非法异常数据;从所述消息队列中获取所述筛选处理后的第一报文数据并进行去重合并处理,得到第二报文数据;利用多模式匹配算法对所述第二报文数据中的敏感数据进行识别,并添加相应敏感标签;将完成所述识别处理后的第二报文数据落库,并进行风险监控。2.根据权利要求1所述的一种数字化信息风险监控方法,其特征在于,所述获取第一报文数据,将所述第一报文数据进行筛选处理后发送到消息队列,所述筛选处理包括去除所述第一报文数据中静态数据和非法异常数据,包括以下步骤:通过配置脚本和应用接口,采集原始流量数据,所述脚本用于控制采集频率和限制采集的数据内容;将所述原始流量数据按照网络报文格式进行解码获取第一报文数据;根据预设的过滤规则对所述第一报文数据进行筛选过滤并格式化后,通过所述脚本推送到消息队列。3.根据权利要求1所述的一种数字化信息风险监控方法,其特征在于,所述从所述消息队列中获取所述筛选处理后的第一报文数据并进行去重合并处理,得到第二报文数据,包括:从所述消息队列中获取所述筛选处理后的第一报文数据,从中提取关键参数,利用信息摘要算法将所述关键参数顺序拼接加密后生成唯一哈希值;根据所述哈希值进行去重合并处理。4.根据权利要求1所述的一种数字化信息风险监控方法,其特征在于,所述利用多模式匹配算法对所述第二报文数据中的敏感数据进行识别,并添加相应敏感标签,包括:根据预设关键字和预设正则表达式对所述第二报文数据的正文内容进行匹配,当匹配相符时,对所述匹配相符的正文内容添加敏感标签;所述预设关键字表示个人隐私身份数据,所述预设正则表达式表示被用来检索、替换那些符合某个模式的文本。5.根据权利要求1所述的一种数字化信息风险监控方法,其特征在于,所述将完成所述识别处理后的第二报文数据落库,并进行风险监控,包括:通过所述哈希值判断第三报文数据是否是新落库的,若数据库中不存在相同的所述哈希值,所述第三报文数据是新落库的,并发起告警推送,以进行风险监控,所述第三报文数据是完成所述识别处理后的第二报文数据落库后得到的;若数据库中存在相同的所述哈希值,则判断是否存在相同的所述敏感标签,若是则设置所述第三报文数据的敏感标签的状态为已修复状态,若否则不进行...

【专利技术属性】
技术研发人员:刘博
申请(专利权)人:杭州振牛信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1