【技术实现步骤摘要】
本专利技术涉及互联网信息管理领域,特别是一种面向网络敏感信息的截图取证与锁定回访的方法。
技术介绍
近年来,互联网在我国快速发展、迅速普及,日益成为人民群众关注社会事务和表达意见的重要渠道。随着我国信息化建设加快推进,互联网在为信息交流带来方便、文化建设注入生机的同时,也使网络敏感信息“插上了翅膀”。敏感信息一般包括三大类政治类、色情类和其他,其一经出现就会引起网民的格外关注,进而产生巨大的舆论压力。借助现代信息技术,网络敏感信息的传播方式、传播速度、影响范围呈几何级数增长,危害巨大。加强此类信息的有效监管,对确保我国构建和谐社会、创造良好的网络文化环境具有重要意义。 然而由于网络上信息量巨大,传统依靠人工的内容监管手段,在敏感信息的及时发现、有效处置方面日益暴露出应对能力有限、处置效率低下的问题。因此,研究面向网络敏感信息的截图取证与锁定回访系统具有重要的现实意义。对包含敏感信息的网页第一时间截图取证,可以防止此类网页日后被更新或删除,方便相关处置机构存档取证以及对屡次发布敏感信息的网站进行处理。此外,此类网页经处置后一段时间可能会再次出现,需对其进行锁定回访避免“死 ...
【技术保护点】
一种面向网络敏感信息的截图取证与锁定回访的方法,包括面向网络敏感信息的截图取证与锁定回访系统,面向网络敏感信息的截图取证与锁定回访的系统包括计算中心和数据库服务器,计算中心与数据库服务器通信,其特征在于,该方法的具体步骤为:1)利用网络爬虫采集网页数据;2)对采集的数据进行预处理,然后利用正则表达式抽取网页中的信息,并利用这些信息进行敏感信息匹配;3)对包含敏感信息的网页进行截图;4)对包含敏感信息的网页进行锁定回访;5)存储截图结果。
【技术特征摘要】
1.一种面向网络敏感信息的截图取证与锁定回访的方法,包括面向网络敏感信息的截图取证与锁定回访系统,面向网络敏感信息的截图取证与锁定回访的系统包括计算中心和数据库服务器,计算中心与数据库服务器通信,其特征在于,该方法的具体步骤为 1)利用网络爬虫采集网页数据; 2)对采集的数据进行预处理,然后利用正则表达式抽取网页中的信息,并利用这些信息进行敏感信息匹配; 3)对包含敏感信息的网页进行截图; 4)对包含敏感信息的网页进行锁定回访; 5)存储截图结果。2.根据权利要求I所述的面向网络敏感信息的截图取证与锁定回访的方法,其特征在于,所述步骤I)中,网络爬虫为LoalaSam。3.根据权利要求I所述的面向网络敏感信息的截图取证与锁定回访的方法,其特征在于,所述步骤2)中,预处理是指对网页进行规范化处理。4.根据权利要求I所述的面向网络敏感信息的截图取证与锁定回访的方法,其特征在于,所述步骤2)中,利用正则表达式抽取网页中的标题、超链接信息。5.根据权利要求I所述的面向网络敏感信息的截图取证与锁定回访的方法,其特征在于,所述步骤2)中,敏感信息匹配为标题匹配,其实现过程如下 1)遍历网页包含的第一个超链接,获取该超链接对应的标题,对其标题进行分词; 2)将用户设定的关键词逐一与标题分词结果进行匹配,判断该标题是否包含设定的关键词; 3)若匹配成功,对该网页进行标记,用于后续外页截图;同时标记该超链接,用于后续内页截图; 4)若匹配未成功,返回I)继续遍历下一个超链接。6.根据权利要求I所述的面向网络敏感信息的截图取证与锁定回访的方法,其特征在于,所述步骤3)中,利用Webbrowser插件中的Navigate及DrawToBitmap方法实现网页截图,其实现过程如下 O将用户所需截图的网页链接URL传递给Navigate方法; 2)Navigate方法将指定URL处的文档加载到WebBrowser插件中,同时为防止网页加载时间过长甚至无法加载成功...
【专利技术属性】
技术研发人员:李芳芳,葛斌,汤大权,肖卫东,殷风景,贺明科,封孝生,谭文堂,
申请(专利权)人:中国人民解放军国防科学技术大学,
类型:发明
国别省市: