一种防止敏感信息泄露的排查方法技术

技术编号:23433230 阅读:43 留言:0更新日期:2020-02-25 13:50
本发明专利技术提供了一种防止敏感信息泄露的排查方法,包括以下步骤:建立数据库,所述数据库中存储有多个关键词;排查:对网络数据平台的源码信息、文件信息、敏感数据和传输数据进行监测;遍历所述源码信息、文件信息、敏感数据和传输数据,提取其中与所述关键词匹配的词语并将它们整合为分析文件;定位所述分析文件中关键词所对应的出现次数、泄露信息、泄露来源、泄露去向和泄露次数并整合成泄露报告;这种防止敏感信息泄露的排查方法是一种基于爬虫技术的源代码泄露监测方法,其目的明确,对互联网各大数据托管平台、网盘、文库等站点的文件进行监控,并利用关键词排查信息泄露的可能性,出现泄漏时及时定位到泄露信息、泄露来源等数据,尽可能的降低损失。

A screening method to prevent the leakage of sensitive information

【技术实现步骤摘要】
一种防止敏感信息泄露的排查方法
本专利技术涉及网络信息安全
,尤其涉及一种防止敏感信息泄露的排查方法。
技术介绍
随着时代的变迁,当前安全形势正在发生改变。从传统的通信安全,到防病毒,再到边界安全以及当前的数据与内容安全。在智慧时代,数据安全成为焦点。在过去一段时间内,出现过以下一些重大信息安全时间:阿里云出现源代码泄露,涉及万科等40家企业200余项目;大疆的漏洞举报邮箱收到一封来自安全研究员KevinFinisterr的海外邮件,对方称在GitHub代码分享社区上,发现有包含大疆源代码等重要敏感信息的链接;Facebook宣布9月25日发生的数据泄露事件影响了至少5000万个帐户,这是因为有黑客对Facebook系统进行了攻击,导致大量隐私被曝光;这些网络信息领域的龙头企业公司也发生了源代码等重要数据泄露,足以证明用户的信息安全仍然存在很大问题。
技术实现思路
本专利技术要解决的技术问题是:针对目前的网络数据平台存在信息泄露的风险,本专利技术提供了一种防止敏感信息泄露的排查方法对互联网各大数据托管平台、网盘、文库等站点的订制化检查与分析,及时定位到泄露信息、泄露来源等信息,尽可能的降低损失。本专利技术解决其技术问题所采用的技术方案是:一种防止敏感信息泄露的排查方法,包括以下步骤:建立数据库,所述数据库中存储有多个关键词;排查:对网络数据平台的源码信息、文件信息、敏感数据和传输数据进行监测;遍历所述源码信息、文件信息、敏感数据和传输数据,提取其中与所述关键词匹配的词语并将它们整合为分析文件;定位所述分析文件中关键词所对应的出现次数、泄露信息、泄露来源、泄露去向和泄露次数并整合成泄露报告。作为优选,还包括以下步骤:提供关键词的管理界面,获取外部输入后对数据库中的关键词进行增加、删减、查找或改动。作为优选,还包括以下步骤:提供任务管理界面,获取外部输入后设置、启动、暂停、修改或停止所述排查。作为优选,还包括以下步骤:提供排查结果界面,所述排查结果界面显示所述泄露报告。作为优选,还包括以下步骤:建立分类表,所述分类表的查询条件为一个标签或者多个标签的组合,所述分类表的查询结果为一个关键词或者多个关键词的组合;为每个所述网络数据平台设置至少一个标签;根据网络数据平台的标签查找所述分类表,将查表的结果作为网络数据平台用于排查的关键词。本专利技术的有益效果是,这种防止敏感信息泄露的排查方法是一种基于爬虫技术的源代码泄露监测方法,其目的明确,对互联网各大数据托管平台、网盘、文库等站点的文件进行监控,并利用关键词排查信息泄露的可能性,出现泄漏时及时定位到泄露信息、泄露来源等数据,尽可能的降低损失。附图说明下面结合附图和实施例对本专利技术进一步说明。图1是本专利技术的一种防止敏感信息泄露的排查方法的流程图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本专利技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本专利技术的实施例所属
的技术人员所理解。如图1所示,本专利技术提供了一种防止敏感信息泄露的排查方法,通过便携式设备中的程序来执行,便携式的设备包括但不限于笔记本电脑、智能手机、平板电脑。便携式设备上的程序的架构包括用户交互层、数据分析层、数据采集层和数据源层。在数据源层,针对不同的网络数据平台,例如百度文库、百度云盘、网易邮箱、阿里云、Github、Facebook等等,分配网络IP地址,调试网络配置参数。建立一个用于存储关键词的数据库,用户交互层在显示器上显示关键词的管理界面,用于通过输入设备对数据库中的关键词进行增加、删减、查找或改动。在数据采集层对网络数据平台上的word、pdf等文本文件进行排查:对网文本文件中的源码信息、文件信息、敏感数据和传输数据进行监测,遍历源码信息、文件信息、敏感数据和传输数据,提取其中与关键词匹配的词语并将它们整合为分析文件;在数据分析层对分析文件中的关键词进行统计、关联、线性等等方式的分析,定位分析文件中关键词所对应的出现次数、泄露信息、泄露来源、泄露去向和泄露次数并整合成泄露报告。用户交互层在显示器上提供排查结果界面,排查结果界面上显示泄露报告,用户看到泄露报告能够及时的对泄露的信息进行处理,阻止更大范围的泄露,降低损失。用户交互层在显示器上提供任务管理界面,用户在任务管理界面上进行操作,在获取外部输入后设置、启动、暂停、修改或停止排查。网络数据平台的种类有很多,他们所存储的数据不尽相同,但是同一类别的平台的数据类型相似,因此可以建立分类表,分类表的查询条件为一个标签或者多个标签的组合,分类表的查询结果为一个关键词或者多个关键词的组合;在用户交互层,用户可以为每个网络数据平台设置至少一个标签;根据网络数据平台的标签查找分类表,将查表的结果作为网络数据平台用于排查的关键词。这样每当用户需要对一个新的平台进行排查时,只要根据平台的类型简单的设置几个标签就可以匹配上较为丰富并且准确的关键词,无需用户一个个的为新平台匹配关键词。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本专利技术的至少一个实施例或示例中。在本说明书中,对所述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征本文档来自技高网
...

【技术保护点】
1.一种防止敏感信息泄露的排查方法,其特征在于,包括以下步骤:/n建立数据库,所述数据库中存储有多个关键词;/n排查:对网络数据平台的源码信息、文件信息、敏感数据和传输数据进行监测;遍历所述源码信息、文件信息、敏感数据和传输数据,提取其中与所述关键词匹配的词语并将它们整合为分析文件;定位所述分析文件中关键词所对应的出现次数、泄露信息、泄露来源、泄露去向和泄露次数并整合成泄露报告。/n

【技术特征摘要】
1.一种防止敏感信息泄露的排查方法,其特征在于,包括以下步骤:
建立数据库,所述数据库中存储有多个关键词;
排查:对网络数据平台的源码信息、文件信息、敏感数据和传输数据进行监测;遍历所述源码信息、文件信息、敏感数据和传输数据,提取其中与所述关键词匹配的词语并将它们整合为分析文件;定位所述分析文件中关键词所对应的出现次数、泄露信息、泄露来源、泄露去向和泄露次数并整合成泄露报告。


2.如权利要求1所述的一种防止敏感信息泄露的排查方法,其特征在于,还包括以下步骤:
提供关键词的管理界面,获取外部输入后对数据库中的关键词进行增加、删减、查找或改动。


3.如权利要求2所述的一种防止敏感信息...

【专利技术属性】
技术研发人员:韩敏曹爱艺李永刚安万平
申请(专利权)人:国网思极检测技术北京有限公司韩敏曹爱艺李永刚安万平国网思极网安科技北京有限公司国网信息通信产业集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1