一种网络中IP设备的位置确定方法及装置制造方法及图纸

技术编号:19598244 阅读:28 留言:0更新日期:2018-11-28 06:36
本发明专利技术实施例公开了一种网络中IP设备的位置确定方法及装置,方法包括在获取到网络中各个目标IP设备(开启了网络服务器功能且存活的IP设备)的IP地址后,根据IP地址向各个目标IP设备发送超文本传输协议请求,以使各个目标IP设备根据超文本传输协议请求中的链接获取网页源代码,并通过端口反馈包括网页源代码的响应消息;接收各个目标IP设备反馈的响应信息,根据每个目标IP设备反馈的网页源代码的类别数和每个目标IP设备反馈的网页源代码判断对应的目标IP设备是否只托管了一个网络服务器;若是,则根据目标IP设备反馈的网页源代码确定目标IP设备的地理位置信息。本发明专利技术可保证目标IP设备的地理位置信息的准确率高。

【技术实现步骤摘要】
一种网络中IP设备的位置确定方法及装置
本专利技术实施例涉及通信
,尤其是涉及一种网络中IP设备的位置确定方法及装置。
技术介绍
IP定位,简而言之,就是通过设备的IP地址来确定其地理位置。随着基于位置的服务越来越普遍,IP定位的应用也越来越广泛。目前IP定位的研究主要是为其它的应用提供服务,例如内容分发、分布式系统等,而其在信息安全领域如数字版权保护、个人隐私保护、网络空间的威胁监测等领域都逐渐受到重视。比如说,在网络空间安防监控设备的搜索及价值评估上--对网络空间中的安防监控设备进行搜索之后,需要进一步对其进行定位,以评估该监控设备对相关研究的价值。通过IP定位技术可以找到距离目标事件最近的最有价值的安防设备,支持相关安全工作的实施。现有的IP定位产品大多是将IP定位到宽泛或具体的地理位置,将IP与经纬度做绑定存储在数据库中,并根据IP地址查找数据库,从数据库中获取IP地址对应的地理位置。定位的精确度也逐渐从粗精度的国家、省级定位提高到城市、区县、街道级定位。从数据侧重点来看,可以分为由数据库、网络测量、数据挖掘驱动这三类。由于数据库存在时效性、精细度不足的问题,这种定位方法的误差较大,因此之后的研究重心从基于数据库的信息推测转移到了以网络测量为基础的定位算法中。而基于网络测量的算法对资源依赖很强,地标数量、地标分布、网络环境对测量结果都有很大的影响。基于网络数据挖掘的方法主要靠挖掘大量明确位置的节点,能够在大量地标的基础上进行定位,地标的数量相对于以往的算法增加了两、三个数量级,可以很大程度上提高精确度。相对于单纯的网络测量的方法,能够获得大量地标,保证大多数的目标附近都能够找到足够多的地标,相对于数据库,地标的粒度更小。在基于网络数据挖掘的定位算法中,通常是通过网络爬虫技术抓取网页,解析网页文本中出现的地理信息来推断目标服务器的地理位置,作为网络地标,或者通过地图服务中出现的网络服务器,挖掘地图上出现的地标设备。传统的通过网络爬虫的IP定位方法发现的地标存在准确性不足的问题,比如,许多网络服务器并不托管在本地,它们依赖CDN网络分发流量或是将网站托管在云服务器中,同时网络爬虫需要抓取大量网页进行识别,是无差别的网页扫描,准确率和时间效率都不够。所以,我们提出一种新的网络地标的发现与鉴别的方法。
技术实现思路
针对现有技术中的缺陷,本专利技术实施例提供一种网络中IP设备的位置确定方法及装置,可保证得到的对应的目标IP设备的地理位置信息的准确率更高。针对以上技术问题,本专利技术的实施例提供了一种网络中IP设备的位置确定方法,包括:在获取到网络中各个目标IP设备的IP地址后,根据所述IP地址向各个目标IP设备发送超文本传输协议请求,以使各个目标IP设备根据所述超文本传输协议请求中的链接获取网页源代码,并通过端口反馈包括所述网页源代码的响应消息;所述目标IP设备为开启了网络服务器功能且存活的IP设备;接收各个目标IP设备反馈的响应信息,根据每个目标IP设备反馈的网页源代码的类别数和每个目标IP设备反馈的网页源代码判断对应的目标IP设备是否只托管了一个网络服务器;若是,则根据目标IP设备反馈的网页源代码确定目标IP设备的地理位置信息。优选的,所述网页源代码包括证书信息;则,根据每个目标IP设备反馈的网页源代码的类别数和每个目标IP设备反馈的网页源代码判断对应的目标IP设备是否只托管了一个网络服务器,包括:判断每个目标IP设备反馈的网页源代码的类别数是否为一个;若是,则判断所述网页源代码中的证书信息与预先存储的其他网站的证书信息是否一致;若否,则确认目标IP设备只托管了一个网络服务器。优选的,判断每个目标IP设备反馈的网页源代码的类别数是否为一个之后,所述方法还包括:若否,则根据目标IP设备反馈的各个网页源代码获取该目标IP设备的注册信息;根据目标IP设备的注册信息判断目标IP设备是否托管了云服务器;若否,则判断目标IP设备的各个网页源代码中是否包括第一预设关键词;若是,则获取对目标IP地址的C段进行探测得到的探测结果,判断探测结果中是否包括邮件服务标识;所述目标IP地址为托管了CDN服务器的目标IP设备的IP地址,所述托管了CDN服务器的目标IP设备为反馈的网页源代码中包括第一预设关键词的目标IP设备,所述探测结果中包括SMTP邮件服务器域名;若是,则判断SMTP邮件服务器域名与对应的托管了CDN服务器的目标IP设备的网络服务器域名是否相同;若是,则确定该托管了CDN服务器的目标IP设备只托管了一个网络服务器。优选的,判断目标IP设备反馈的各个网页源代码中是否包括第一预设关键词之后,所述方法还包括:若否,则获取各个网页文本内容中的至少一种特征信息;所述网页文本内容为目标IP设备反馈的网页源代码中的网页文本内容;计算任意两个网页文本内容的同一种类的特征信息的相似度;根据特征信息的总种类数和各个相似度判断目标IP设备是否只托管了一个网络服务器。优选的,根据特征信息的总种类数和各个相似度判断目标IP设备是否只托管了一个网络服务器,包括:统计任意两个网页文本内容中相似度大于等于预设阈值的特征信息的种类数;若判断获知目标种类数与所述特征信息的总种类数的比例大于等于预设比例,则确定目标IP设备只托管了一个网络服务器;所述目标种类数为两个网页文本内容中相似度大于等于预设阈值的特征信息的种类数。优选的,根据目标IP设备反馈的网页源代码确定目标IP设备的地理位置信息,包括:获取目标IP设备反馈的网页源代码中的各个地理位置信息、各个地理位置信息在所述网页源代码中出现的次数以及各个地理位置信息的上下文信息;判断各个地理位置信息的上下文信息中是否包括第二预设关键词,并根据判断结果为各个地理位置信息赋予第一权重;根据各个地理位置信息在所述网页源代码中出现的次数为各个地理位置信息赋予第二权重;根据各个第一权重和第二权重,确定目标IP设备的地理位置信息。优选的,根据各个第一权重和第二权重,确定目标IP设备的地理位置信息,包括:根据各个第一权重和第二权重,计算各个地理位置信息的总权重指数;将总权重指数最大的地理位置信息确定为目标IP设备的地理位置信息。优选的,根据所述IP地址向各个目标IP设备发送超文本传输协议请求之前,所述方法还包括:获取探测服务器发送的网络中的各个预设端口的扫描信息;所述扫描信息包括存活的IP设备的IP地址;获取探测服务器根据所述存活的IP设备的IP地址扫描的存活的IP设备的端口数据;根据所述端口数据判断所述存活的IP设备是否开启了网络服务器功能;若是,则确认该IP设备为所述目标IP设备。优选的,所述方法还包括:建立目标IP设备的地理位置信息和目标IP设备的IP地址的对应关系并存储。第二方面,本专利技术实施例还提供一种网络中IP设备的位置确定装置,包括:发送单元,用于在获取到网络中各个目标IP设备的IP地址后,根据所述IP地址向各个目标IP设备发送超文本传输协议请求,以使各个目标IP设备根据所述超文本传输协议请求中的链接获取网页源代码,并通过端口反馈包括所述网页源代码的响应消息;所述目标IP设备为开启了网络服务器功能且存活的IP设备;判断单元,用于接收各个目标IP设备反馈的响应信息,根据每个目标IP设备反馈的网页源本文档来自技高网
...

【技术保护点】
1.一种网络中IP设备的位置确定方法,其特征在于,包括:在获取到网络中各个目标IP设备的IP地址后,根据所述IP地址向各个目标IP设备发送超文本传输协议请求,以使各个目标IP设备根据所述超文本传输协议请求中的链接获取网页源代码,并通过端口反馈包括所述网页源代码的响应消息;所述目标IP设备为开启了网络服务器功能且存活的IP设备;接收各个目标IP设备反馈的响应信息,根据每个目标IP设备反馈的网页源代码的类别数和每个目标IP设备反馈的网页源代码判断对应的目标IP设备是否只托管了一个网络服务器;若是,则根据目标IP设备反馈的网页源代码确定目标IP设备的地理位置信息。

【技术特征摘要】
1.一种网络中IP设备的位置确定方法,其特征在于,包括:在获取到网络中各个目标IP设备的IP地址后,根据所述IP地址向各个目标IP设备发送超文本传输协议请求,以使各个目标IP设备根据所述超文本传输协议请求中的链接获取网页源代码,并通过端口反馈包括所述网页源代码的响应消息;所述目标IP设备为开启了网络服务器功能且存活的IP设备;接收各个目标IP设备反馈的响应信息,根据每个目标IP设备反馈的网页源代码的类别数和每个目标IP设备反馈的网页源代码判断对应的目标IP设备是否只托管了一个网络服务器;若是,则根据目标IP设备反馈的网页源代码确定目标IP设备的地理位置信息。2.根据权利要求1所述的方法,其特征在于,所述网页源代码包括证书信息;则,根据每个目标IP设备反馈的网页源代码的类别数和每个目标IP设备反馈的网页源代码判断对应的目标IP设备是否只托管了一个网络服务器,包括:判断每个目标IP设备反馈的网页源代码的类别数是否为一个;若是,则判断所述网页源代码中的证书信息与预先存储的其他网站的证书信息是否一致;若否,则确认目标IP设备只托管了一个网络服务器。3.根据权利要求2所述的方法,其特征在于,判断每个目标IP设备反馈的网页源代码的类别数是否为一个之后,所述方法还包括:若否,则根据目标IP设备反馈的各个网页源代码获取该目标IP设备的注册信息和该目标IP设备的网络服务器域名;根据目标IP设备的注册信息判断目标IP设备是否托管了云服务器;若否,则判断目标IP设备的各个网页源代码中是否包括第一预设关键词;若是,则获取对目标IP地址的C段进行探测得到的探测结果,判断探测结果中是否包括邮件服务标识;所述目标IP地址为托管了CDN服务器的目标IP设备的IP地址,所述托管了CDN服务器的目标IP设备为反馈的网页源代码中包括第一预设关键词的目标IP设备,所述探测结果中包括SMTP邮件服务器域名;若是,则判断SMTP邮件服务器域名与对应的托管了CDN服务器的目标IP设备的网络服务器域名是否相同;若是,则确定该托管了CDN服务器的目标IP设备只托管了一个网络服务器。4.根据权利要求3所述的方法,其特征在于,判断目标IP设备反馈的各个网页源代码中是否包括第一预设关键词之后,所述方法还包括:若否,则获取各个网页文本内容中的至少一种特征信息;所述网页文本内容为目标IP设备反馈的网页源代码中的网页文本内容;计算任意两个网页文本内容的同一种类的特征信息的相似度;根据特征信息的总种类数和各个相似度判断目标IP设备是否只托管了一个网络服务器。5.根据权利要求4所述的方法,其特征在于,根据特征信息的总种类数和各个相似度判断目标IP设备是否只托管了一个网络服务器,包括:统计任意两个网页文本内容中相似度大于等于预设阈值的特征信息的种类数;若判断获知目标种类数与所述特征信息的总种类数的...

【专利技术属性】
技术研发人员:常丽娟王志豪于楠朱红松孙利民
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1