一种IP地址业务属性标定方法及装置制造方法及图纸

技术编号:20448793 阅读:31 留言:0更新日期:2019-02-27 02:55
本发明专利技术涉及一种IP地址业务属性标定方法及装置,所述方法包括:获取域名的子域名以及域名及其子域名的页面信息;利用预先建立的文本分类机器学习模型获取域名及其子域名的页面信息的分类结果;利用域名及其子域名的页面信息的分类结果标定域名及其子域名对应的IP地址集的分类属性。本发明专利技术提供的技术方案,通过网络爬虫获得域名的页面信息,利用机器学习文本分类算法模型确定域名的业务分类,建立“IP‑域名‑业务分类”的映射关系,完成对IP地址上层承载业务分类的标定,扩充了现有的IP地址属性库,提高了IP业务属性的实时性。

An IP Address Service Attribute Calibration Method and Device

The present invention relates to an IP address service attribute calibration method and device. The method includes: acquiring domain name subdomain and page information of domain name and its subdomain name; acquiring page information classification results of domain name and its subdomain name by using pre-established text categorization machine learning model; and using page information classification results of domain name and its subdomain name to calibrate domain name and its subdomain. Classification attributes of IP address set corresponding to the name. The technical scheme provided by the invention obtains the page information of domain name through network crawler, determines the service classification of domain name by using machine learning text classification algorithm model, establishes the mapping relationship of IP domain name service classification, completes the calibration of the service classification of IP address upper layer, expands the existing IP address attribute library, and improves the real-time property of IP service.

【技术实现步骤摘要】
一种IP地址业务属性标定方法及装置
本专利技术涉及互联网领域,具体涉及一种IP地址业务属性标定方法及装置。
技术介绍
IP地址作为互联网的核心,是连接人、物、环境的纽带。传统的IP地址属性研究偏重于位置属性研究,典型应用包括IP地址定位服务、网络流量智能调度、智能DNS解析以及精准投放取悦广告等,原理是根据IP地址位置的不同推送个性化服务,但是无法确定IP地址上层承载的业务属性,不利于网络安全态势感知。
技术实现思路
本专利技术提供一种IP地址业务属性标定方法及装置,其目的是通过网络爬虫获得域名的页面信息,利用机器学习文本分类算法模型确定域名的业务分类,建立“IP-域名-业务分类”的映射关系,完成对IP地址上层承载业务分类的标定,扩充了现有的IP地址属性库,提高了IP业务属性的实时性。本专利技术的目的是采用下述技术方案实现的:一种IP地址业务属性标定方法,其改进之处在于,所述方法包括:获取域名的子域名以及域名及其子域名的页面信息;利用预先建立的文本分类机器学习模型获取域名及其子域名的页面信息的分类结果;利用域名及其子域名的页面信息的分类结果标定域名及其子域名对应的IP地址集的分类属性。优本文档来自技高网...

【技术保护点】
1.一种IP地址业务属性标定方法,其特征在于,所述方法包括:获取域名的子域名以及域名及其子域名的页面信息;利用预先建立的文本分类机器学习模型获取域名及其子域名的页面信息的分类结果;利用域名及其子域名的页面信息的分类结果标定域名及其子域名对应的IP地址集的分类属性。

【技术特征摘要】
1.一种IP地址业务属性标定方法,其特征在于,所述方法包括:获取域名的子域名以及域名及其子域名的页面信息;利用预先建立的文本分类机器学习模型获取域名及其子域名的页面信息的分类结果;利用域名及其子域名的页面信息的分类结果标定域名及其子域名对应的IP地址集的分类属性。2.如权利要求1所述的方法,其特征在于,所述获取域名的子域名以及域名及其子域名的页面信息,包括:a.判断域名是否合法,若所述域名合法,则执行步骤b,否则结束操作;b.利用网络爬虫方法获取域名的首页信息,若所述首页信息的页面内容为空,则结束操作,否则执行步骤c;c.利用正则表达式匹配获取所述首页信息中的子域名,并输出该子域名;d.对子域名重复执行步骤a至c,直至子域名中不存在嵌套的子域名。3.如权利要求1所述的方法,其特征在于,所述预先建立的文本分类机器学习模型的建立过程,包括:A.利用历史已标定分类属性的页面信息作为文本分类机器学习模型的训练数据和测试数据,利用训练数据训练文本分类机器学习模型;B.利用测试数据测试所述文本分类机器学习模型的正确率,若所述文本分类机器学习模型的正确率达到85%及以上,则输出该文本分类机器学习模型,若否,则修改文本分类机器学习模型的参数,并返回步骤A;其中,所述文本分类机器学习模型为基于CNN/RNN的文本分类算法,所述文本分类机器学习模型的参数可以为学习率,神经网络层数。4.如权利要求1所述的方法,其特征在于,所述利用预先建立的文本分类机器学习模型获取域名及其子域名的页面信息的分类结果之前,包括:去掉域名及其子域名的页面信息中的代码信息。5.如权利要求1所述的方法,其特征在于,所述域名及其子域名对应的IP地址集的获取过程,包括:根据DNS解析原理,利用至少一个DNS服务器解析获取一个域名或其子域名对应的至少一个IP地址,利用一个域名或其子域名对应的至少一个IP地址构建所述域名或其子域名对应的IP地址集,其中,DNS服务器与域名或其子域名对应的IP地址一一对应。6.一种IP地址业务属性标定装置,其特征在于,所述装置...

【专利技术属性】
技术研发人员:窦禹陆希玉曹华平李晗张沛谢波王云荣刘博元易立杨云龙
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1