基于互联网基础资源的IP地址关联分析方法和分析系统技术方案

技术编号:20014672 阅读:21 留言:0更新日期:2019-01-05 22:43
本发明专利技术提供一种基于互联网基础资源的IP地址关联分析方法,包括以下步骤:通过数据采集技术获取互联网基础资源的业务数据,对所述业务数据的元数据信息的含义进行标引;根据标引后的所述元数据信息,提取所述业务数据的IP地址和IP属性数据,并对所述业务数据的业务属性进行关联分析;根据得到的关联分析结果,通过所述IP地址对若干个所述业务数据的业务属性进行关联核验,发现错报、漏报的业务数据,得到所述业务数据的核验结果。本发明专利技术所述的基于互联网基础资源的IP地址关联分析方法,能够有效利用IP地址属性数据、挖掘相关业务数据内部之间的联系、有效利用业务数据的价值。

IP Address Association Analysis Method and Analysis System Based on Internet Basic Resources

The invention provides an IP address association analysis method based on Internet basic resources, which includes the following steps: acquiring the business data of Internet basic resources through data acquisition technology, indexing the meaning of metadata information of the business data, extracting the IP address and IP attribute data of the business data according to the metadata information after indexing, and then processing the business data. The business attributes of the data are correlated and analyzed. According to the results of the correlation analysis, the business attributes of several business data are correlated and verified by the IP address. The business data of misstatement and omission are found, and the verification results of the business data are obtained. The IP address association analysis method based on Internet basic resources of the invention can effectively utilize IP address attribute data, mine the internal links of relevant business data, and effectively utilize the value of business data.

【技术实现步骤摘要】
基于互联网基础资源的IP地址关联分析方法和分析系统本申请要求2018年04月13日递交的申请号为201810333342.3、专利技术名称为基于互联网基础资源的IP地址关联分析方法和分析系统的专利技术专利申请优先权,其以参考方式并入此申请。
本专利技术属于互联网
,具体而言,涉及一种基于互联网基础资源的IP地址关联分析方法和分析系统。
技术介绍
目前在平台系统中,IP地址属性数据分布在互联网、业务网以及其它相关网络中,IP地址属性数据没有建立持续更新机制,制约了数据分析挖掘能力、数据综合展示能力的形成。随着相关业务数据的不断增长,不能有效利用IP地址属性数据进行分析统计,以及挖掘相关业务数据内部之间的联系,无法利用业务数据的价值。鉴于此,目前亟待提出一种基于互联网基础资源的IP地址关联分析方法和分析系统,有效利用IP地址属性数据,挖掘相关业务数据内部之间的联系,有效利用业务数据的价值。
技术实现思路
本专利技术的目的在于提供一种基于互联网基础资源的IP地址关联分析方法和分析系统,以有效利用IP地址属性数据、挖掘相关业务数据内部之间的联系、有效利用业务数据的价值。为此,本专利技术提供了一种基于互联网基础资源的IP地址关联分析方法,包括以下步骤:步骤一:通过数据采集技术获取互联网基础资源的业务数据,并将所述业务数据存储于数据库或文件中;步骤二:获取步骤一中存储于所述数据库中的所述业务数据,对所述业务数据的元数据信息的含义进行标引;步骤三:根据步骤二中得到的标引后的所述元数据信息,提取所述业务数据的IP地址和IP属性数据,并对所述业务数据的业务属性进行关联分析;步骤四:根据步骤三中得到的关联分析结果,通过所述IP地址对若干个所述业务数据的业务属性进行关联核验,发现错报、漏报的业务数据,得到所述业务数据的核验结果。优选地,在步骤一中,所述数据采集技术为自动化同步采集;所述自动化同步采集包括如下步骤:S11、在包含所述互联网基础资源的业务数据的系统中设定业务同步周期,当达到所述业务同步周期的阈值时,包含所述互联网基础资源的业务数据的系统向数据同步中心发送同步内容和同步数据源的同步请求;S12、所述数据同步中心接到步骤S11中所述的同步请求后,向包含所述互联网基础资源的业务数据的系统发送是否有空闲资源进行数据同步的询问指令;S13、包含所述互联网基础资源的业务数据的系统收到步骤S12中所述的询问指令后,向所述数据同步中心发出确认指令;S14、所述数据同步中心接收到步骤S13中的确认指令后,向包含所述互联网基础资源的业务数据的系统发送可以同步的同步指令;S15、包含所述互联网基础资源的业务数据的系统接到步骤S14中所述的同步指令后,调用同步程序,进行数据同步;当同步完成后,再向所述数据同步中心发送同步完成指令;S16、所述数据同步中心收到步骤S15中所述的同步完成指令后,通过展示系统展示业务数据的同步结果。进一步优选地,在步骤一中,所述自动化同步采集还包括网络安全隔离的步骤;所述网络安全隔离具体如下:将所述数据同步中心的服务器、包含所述互联网基础资源的业务数据的系统的服务器之间通过交换机连接,并通过UDP通信协议进行数据通信。进一步优选地,所述互联网基础资源包括IP备案数据、网站备案数据、域名备案数据、境内外VPN数据、流量数据、IPMarker数据、网络安全数据;所述业务数据包括地理位置信息、运营商信息、网关信息、CDN信息、网站信息、域名信息、IDC信息其中的一种或多种;所述数据库包括关系型数据库、内存数据库、分布式数据库;所述文件包括IP五元组日志文件、纯真库的数据库文件、IP2LOCATION库的数据库文件、GEOIP库的数据库文件。优选地,所述步骤二具体包括如下步骤:S21、获取步骤一中存储于所述数据库中的所述业务数据的元数据信息,对所述元数据信息的含义进行规范;S22、对步骤S21中得到的含义规范后的所述元数据信息进行数据清洁,去除其中的脏数据;S23、对步骤S22中得到的剩余的所述元数据信息进行整合,对所述元数据信息的含义进行标,将含义相同的数据采用统一的标识进行表示。优选地,所述步骤三具体包括如下步骤:S31、根据步骤二中得到的标引后的元数据信息构建IP属性拓扑图,并根据得到的所述IP属性拓扑图对所述元数据信息进行属性匹配;S32、根据步骤S31得到的匹配结果,提取所述业务数据的业务属性数据;S33、将步骤S32中得到的所述业务属性数据与IP地址进行关联,得到关联分析结果;其中,所述业务属性是指IP备案信息与域名备案信息;所述IP备案信息包括备案时间、分配方式、分配单位及其单位信息、接入单位及其单位信息、IP使用单位及其单位信息、IP分配链条;所述域名备案信息包括域名信息、DNS服务器、解析IP地址、权威解析记录、递归解析记录。优选地,所述IP属性数据包括地理属性、网络属性、节点属性、事件属性;所述地理属性包括国家信息、区域信息、省信息、市信息、县信息、详细地址信息、经纬度信息;所述网络属性包括BGP、AS域、域名、应用服务类型、使用方式;所述节点属性包括DNS解析信息、流量五元组信息;所述事件属性包括资源获取事件、恶意代码事件、WEB安全事件;所述IP属性拓扑图以IP地址为中心,包括一级分支、以及所述以及分支下扩展的二级分支;所述一级分支包括地理属性、网络属性、节点属性和行为属性;所述二级分支包括属性名称;所述属性名称包括省、市、县信息,As信息,运营商信息。优选地,所述步骤四具体包括如下步骤:根据步骤三中得到的关联分析结果,通过所述IP地址对若干个所述业务数据的业务属性进行关联核验,进行完整性检查和准确性检查,得到所述业务数据的核验结果。所述关联核验包括如下步骤:将所述IP地址的地理位置信息与所述IP备案信息中的IP地址的接入位置按省信息进行比较;当省信息不相同时,判断IP地址的分配方式、接入位置和实际使用位置,归纳省信息的备案规律;当省相同时,进一步按市信息进行比较,当市信息不相同时,判断IP地址的分配方式、接入位置和实际使用位置,归纳市信息的备案规律;将所述IP地址的地理位置信息与所述IP备案信息中IP地址的使用位置按省进行比较;当省信息不相同时,判断IP地址的分配方式、接入位置和实际使用位置,归纳省信息的备案规律;当省信息相同时,进一步按市信息进行比较,当市信息不相同时,判断IP地址的分配方式、接入位置和实际使用位置,归纳市信息的备案规律;将所述IP地址的地理位置信息与所述IP备案信息中IP地址的运营商进行比较;当运营商不相同时,判断IP地址的分配方式、接入位置和实际使用位置,归纳运营商的备案规律。本专利技术提供了一种基于互联网基础资源的IP地址关联分析的系统,所述系统适于所述的基于互联网基础资源的IP地址关联分析方法。优选地,所述的系统,包括如下子系统:任务管理系统,所述任务管理系统用于下发业务数据的采集和迁移任务;数据采集汇入系统,所述数据采集汇入系统与所述任务管理系统相连,用于接收所述任务管理系统的指令,采集互联网基础资源的业务数据并进行存储;IP数据分析系统,所述IP数据分析系统用于对所述数据采集汇入系统采集、存储的所述业务数据进行关联性分析及核验;数据迁移系统,所述数据迁移系统分别与所述本文档来自技高网...

【技术保护点】
1.一种基于互联网基础资源的IP地址关联分析方法,其特征在于,包括以下步骤:步骤一:通过数据采集技术获取互联网基础资源的业务数据,并将所述业务数据存储于数据库或文件中;步骤二:获取步骤一中存储于所述数据库中的所述业务数据,对所述业务数据的元数据信息的含义进行标引;步骤三:根据步骤二中得到的标引后的所述元数据信息,提取所述业务数据的IP地址和IP属性数据,并对所述业务数据的业务属性进行关联分析;步骤四:根据步骤三中得到的关联分析结果,通过所述IP地址对若干个所述业务数据的业务属性进行关联核验,发现错报、漏报的业务数据,得到所述业务数据的核验结果。

【技术特征摘要】
2018.04.13 CN 20181033334231.一种基于互联网基础资源的IP地址关联分析方法,其特征在于,包括以下步骤:步骤一:通过数据采集技术获取互联网基础资源的业务数据,并将所述业务数据存储于数据库或文件中;步骤二:获取步骤一中存储于所述数据库中的所述业务数据,对所述业务数据的元数据信息的含义进行标引;步骤三:根据步骤二中得到的标引后的所述元数据信息,提取所述业务数据的IP地址和IP属性数据,并对所述业务数据的业务属性进行关联分析;步骤四:根据步骤三中得到的关联分析结果,通过所述IP地址对若干个所述业务数据的业务属性进行关联核验,发现错报、漏报的业务数据,得到所述业务数据的核验结果。2.根据权利要求1所述的基于互联网基础资源的IP地址关联分析方法,其特征在于:在步骤一中,所述数据采集技术为自动化同步采集;所述自动化同步采集包括如下步骤:S11、在包含所述互联网基础资源的业务数据的系统中设定业务同步周期,当达到所述业务同步周期的阈值时,包含所述互联网基础资源的业务数据的系统向数据同步中心发送同步内容和同步数据源的同步请求;S12、所述数据同步中心接到步骤S11中所述的同步请求后,向包含所述互联网基础资源的业务数据的系统发送是否有空闲资源进行数据同步的询问指令;S13、包含所述互联网基础资源的业务数据的系统收到步骤S12中所述的询问指令后,向所述数据同步中心发出确认指令;S14、所述数据同步中心接收到步骤S13中的确认指令后,向包含所述互联网基础资源的业务数据的系统发送可以同步的同步指令;S15、包含所述互联网基础资源的业务数据的系统接到步骤S14中所述的同步指令后,调用同步程序,进行数据同步;当同步完成后,再向所述数据同步中心发送同步完成指令;S16、所述数据同步中心收到步骤S15中所述的同步完成指令后,通过展示系统展示业务数据的同步结果。3.根据权利要求2所述的基于互联网基础资源的IP地址关联分析方法,其特征在于:在步骤一中,所述自动化同步采集还包括网络安全隔离的步骤;所述网络安全隔离具体如下:将所述数据同步中心的服务器、包含所述互联网基础资源的业务数据的系统的服务器之间通过交换机连接,并通过UDP通信协议进行数据通信。4.根据权利要求3所述的基于互联网基础资源的IP地址关联分析方法,其特征在于:所述互联网基础资源包括IP备案数据、网站备案数据、域名备案数据、境内外VPN数据、流量数据、IPMarker数据、网络安全数据;所述业务数据包括地理位置信息、运营商信息、网关信息、CDN信息、网站信息、域名信息、IDC信息其中的一种或多种;所述数据库包括关系型数据库、内存数据库、分布式数据库;所述文件包括IP五元组日志文件、纯真库的数据库文件、IP2LOCATION库的数据库文件、GEOIP库的数据库文件。5.根据权利要求1-4中任意一项所述的基于互联网基础资源的IP地址关联分析方法,其特征在于,所述步骤二具体包括如下步骤:S21、获取步骤一中存储于所述数据库中的所述业务数据的元数据信息,对所述元数据信息的含义进行规范;S22、对步骤S21中得到的含义规范后的所述元数据信息进行数据清洁,去除其中的脏数据;S23、对步骤S22中得到的剩余的所述元数据信息进行整合,对所述元数据信息的含义进行标,将含义相同的数据采用统一的标识进行表示。6.根据权利要求1-4中任意一项所述的基于互联网基础资源的IP地址关联分析方法,其特征在于,所述步骤三具体包括如下步骤:S31、根据步骤二中得到的...

【专利技术属性】
技术研发人员:李晗窦禹郝振江袁立李勉
申请(专利权)人:国家计算机网络与信息安全管理中心天津市国瑞数码安全系统股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1