【技术实现步骤摘要】
一种暗网监控方法、系统及存储介质
[0001]本专利技术涉及暗网数据获取
,尤其涉及的是一种暗网监控方法、系统及存储介质。
技术介绍
[0002]暗网(也被称为:深网、不可见网或隐藏网)是指那些存储在网络数据库里、但不能通过超链接访问而需要通过动态网页技术访问的资源集合(即无法通过搜索引擎搜索)。搜索引擎之所以不会收录暗网,通常是因为网站或服务的配置错误、拒绝爬虫爬取信息、需要付费查看、需要注册查看或其他内容访问限制。暗网最主要的特点是保证匿名,其匿名性体现在两个方面:(1)访问普通网站时,网站无法得知访问者IP地址;(2)提供暗网服务时,用户无法得知服务器IP地址。两个性质加起来则使得暗网用户访问网站时,双方都无法得知对方 IP 地址,且中间节点也无法同时得知双方IP地址。当进行数据传输时,系统只会显示用户连接的暗网以及传输的数据量,而不会显示用户访问的网站或所涉及数据的内容。
[0003]有数据指出浏览暗网所用的 Tor 浏览器年下载量在 5000 万,根据 Tor 官方项目的统计数据显示,2018 年上半 ...
【技术保护点】
【技术特征摘要】
1.一种暗网监控方法,其特征在于,包括:通过VPS技术部署数据爬虫节点,实时爬取暗网内的中继节点信息及出口节点信息;根据爬取的信息建立并实时更新用于记载中继节点信息的中继节点列表,以及用于记载出入口节点信息的出入口节点列表;实时监控中继节点列表内的中继节点数据流转信息,以及出入口节点列表内的出口节点数据收取信息,并爬取出口节点所接收的明文数据;根据所爬取的出口节点信息及中继节点信息进行数据匹配,追溯数据流转路线,获得入口节点信息,构建完整数据流转链并存储;接收执法人员输入的关键词,将关键词与所爬取的明文数据进行数据碰撞,并显示具有所述关键词的所有完整数据流转链。2.根据权利要求1所述的暗网监控方法,其特征在于,所述暗网监控方法还包括步骤:通过VPS技术部署数据爬虫节点,爬取暗网网站信息并进行存储,所述暗网网站信息包括:域名及类型;根据暗网网站类型编写对应的爬虫插件,并利用所述爬虫插件爬取所述暗网网站的内容信息;对爬取的内容信息进行分词解析,提取解析得到的非法信息并存储。3.根据权利要求2所述的暗网监控方法,其特征在于,所述内容信息的爬取方法具体为:当用户访问网站产生Http请求并调用API接口时,通过API接口回调数据。4.根据权利要求3所述的暗网监控方法,其特征在于,所述当用户访问网站产生Http请求并调用API接口时,通过API接口回调数据的步骤之后包括:将回调的数据进行分词解析,根据解析结果生成非法信息列表及非法信息详情,并将所述非法信息列表存储于ES数据库,将所述非法信息详情存储于Mongo数据库。5.根据权利要求4所述的暗网监控方法,其特征在于,所述对爬取的内容信息进行分词解析,提取解析得到的非法信息并存储的步骤之后还包括...
【专利技术属性】
技术研发人员:李有为,肖亮,
申请(专利权)人:深圳安巽科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。