一种互联网邮箱系统的识别方法技术方案

技术编号:23608960 阅读:34 留言:0更新日期:2020-03-28 08:59
本发明专利技术涉及一种互联网邮箱系统的识别方法,收集互联网的网站首页,爬取网站首页信息,获取网站的邮箱服务类型数据的IP及对应的端口数据,清洗得到的数据,分别存储至数据库中,取数据库中的数据,进行规则匹配,对互联网网站进行标注,识别互联网邮箱系统。本发明专利技术获取大量互联网网站,利用网站指纹、网站标题以及利用扫描工具获取IP和IP开放的端口服务等规则,对互联网邮箱系统进行识别,可以在短时间内、从众多的互联网网站中快速识别并标注邮箱系统,极大程度上减少人工参与,快速识别邮箱系统,为相应的监管人提供便利。

An identification method of Internet mailbox system

【技术实现步骤摘要】
一种互联网邮箱系统的识别方法
本专利技术涉及电数字数据处理的
,特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法的一种互联网邮箱系统的识别方法。
技术介绍
随着互联网的飞速发展,人们使用邮箱系统的次数日益增多,互联网上也开放了很多邮箱系统的网站,这些网站成为了黑客的目标网站,基于这些网站,黑客窃取了大量的重要文件、信息,并可以基于这些网站传播计算机病毒文件。在这种大前提下,快速识别互联网上开放的邮箱系统是非常重要的,快速识别互联网邮箱系统是加强对邮箱系统的安全监管的有效途径。现有技术中,互联网上网站虽多,但识别这些网站的类型的途径却有所欠缺,一般来说,还是主要通过人工进行判断,然而,通过人工判断的工作量巨大,需要先进行识别、再进行匹配,效率低,且识别中易出现疏漏。
技术实现思路
本专利技术解决了现有技术中,主要通过人工判断识别互联网邮箱系统,而导致的工作量巨大、效率低、易出现疏漏的问题,提供了一种优化的互联网邮箱系统的识别方法,利用一定规则进行互联网邮箱系统的识别。本专利技术本文档来自技高网...

【技术保护点】
1.一种互联网邮箱系统的识别方法,其特征在于:所述方法包括以下步骤:/n步骤1:收集互联网的网站首页,爬取网站首页信息;/n步骤2:获取网站的邮箱服务类型数据的IP及对应的端口数据;/n步骤3:清洗步骤1和步骤2得到的数据,分别存储至数据库中;/n步骤4:取数据库中的数据,进行规则匹配,对互联网网站进行标注,识别互联网邮箱系统。/n

【技术特征摘要】
1.一种互联网邮箱系统的识别方法,其特征在于:所述方法包括以下步骤:
步骤1:收集互联网的网站首页,爬取网站首页信息;
步骤2:获取网站的邮箱服务类型数据的IP及对应的端口数据;
步骤3:清洗步骤1和步骤2得到的数据,分别存储至数据库中;
步骤4:取数据库中的数据,进行规则匹配,对互联网网站进行标注,识别互联网邮箱系统。


2.根据权利要求1所述的一种互联网邮箱系统的识别方法,其特征在于:所述步骤1中,以网络爬虫定向获取互联网的网站首页。


3.根据权利要求1所述的一种互联网邮箱系统的识别方法,其特征在于:所述步骤1中,网站首页信息还包括网站首页的body、header、title、URL、IP和端口。


4.根据权利要求1所述的一种互联网邮箱系统的识别方法,其特征在于:所述步骤2中,邮箱服务类型数据的IP及对应的端口数据通过扫描IP开放的端口并识别端口处开通的邮箱服务类型获得。


5.根据权利要求3所述的一种互联网邮箱系统的识别方法,其特征在于:所述步骤4包括以下步骤:
步骤4.1:取数据库中步骤1得到的数据,进行规则匹配;
步骤4.2:对匹配成功的数据标注对应的互联网网站,识别互联网邮箱系统;匹配未成功的数据...

【专利技术属性】
技术研发人员:温延龙范渊
申请(专利权)人:杭州安恒信息技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1