【技术实现步骤摘要】
一种基于IP地址画像的装置
本专利技术涉及信息
的信息安全
,尤其是互联网管控领域。
技术介绍
目前,存在各种各样与IP地址相关的孤立数据源。如何整合这些数据源,进行聚合分析,建立IP地址画像模型,提炼出对IP地址的全方位画像,从而提前对存在潜在风险的IP地址进行预警,就成为行业监管部门关注的焦点。通过行业监管部门的现有系统或技术手段可以拿到IP备案数据、网络安全事件数据、DNS日志数据、IP地址对应的网站信息。同时可以得到域名注册数据、网站接入数据、域名权威解析数据、违法违规及黑名单数据、诈骗网站信息库数据、恶意网站信息库数据等。但各个数据源之间都是孤立的,存在数据孤岛问题。本专利通过聚合多个数据源,打破数据孤岛,形成一个针对IP地址的360度视觉,包括他们行为和事件的实时分析,形成对IP地址的精准、丰富的画像。同时结合机器学习,对画像后的IP地址进行进一步分析与预测,为行业监管部门的工作提供重要参考。检索网站画像的现有技术发现CN201610831737.7,基于网站画像的异常访问日志挖掘方法及装置的专利技术专利,CN201610831737.7的 ...
【技术保护点】
一种基于IP地址画像的装置,其特征在于由数据采集器、数据挖掘器、多维画像器组成;数据采集器由数据获取模块、数据清洗模块、数据格式化模块组成;数据挖掘器由关联分析模块、数据建模模块组成;多维画像器由标签匹配模块、多维画像模块组成;数据获取模块由IP备案数据获取模块、爬虫数据获取模块、域名注册信息获取模块、IP接入数据获取模块、域名解析数据获取模块、DNS日志数据获取模块、网站备案数据获取模块、违法违规及黑名单网站数据获取模块、网络安全事件获取模块、诈骗网站信息获取模块、恶意网站信息获取模块组成;IP备案数据获取模块的功能是通过接口方式获得IP地址所属接入单位、使用单位、分配来 ...
【技术特征摘要】
1.一种基于IP地址画像的装置,其特征在于由数据采集器、数据挖掘器、多维画像器组成;数据采集器由数据获取模块、数据清洗模块、数据格式化模块组成;数据挖掘器由关联分析模块、数据建模模块组成;多维画像器由标签匹配模块、多维画像模块组成;数据获取模块由IP备案数据获取模块、爬虫数据获取模块、域名注册信息获取模块、IP接入数据获取模块、域名解析数据获取模块、DNS日志数据获取模块、网站备案数据获取模块、违法违规及黑名单网站数据获取模块、网络安全事件获取模块、诈骗网站信息获取模块、恶意网站信息获取模块组成;IP备案数据获取模块的功能是通过接口方式获得IP地址所属接入单位、使用单位、分配来源、接入网站等;爬虫数据获取模块的功能是通过网络爬虫可以获取网站内容数据,并对内容进行分类,获取网站所属行业信息;域名注册信息获取模块的功能是通过离线方式获得域名注册信息,例如注册时间、过期时间、注册人等;IP接入数据获取模块的功能是通过离线方式IP接入网站、接入商、接入机房等信息;域名解析数据获取模块的功能是通过离线方式获得域名权威解析信息,例如IP地址、解析状态、托管开始时间等;DNS日志数据获取模块的功能是通过在DNS节点部署探针,对流量进行镜像,采集UDP协议的响应包,并从数据中提取DNS六元组信息,DNS六元组信息包括:CNAME,源IP,目的IP,解析IP,Domain,访问时间;网站备案数据获取模块的功能是通过离线方式获得网站备案单位名称、地址、备案状态等信息;违法违规及黑名单网站数据获取模块的功能是通过接口方式获得违法违规及黑名单网站信息;网络安全事件获取模块的功能是通过接口方式获得存在网络安全问题的网站列表信息;诈骗网站信息获取模块的功能是通过接口方式获得目前已知的诈骗网站列表;恶意网站信息获取模块的功能是通过接口方式获得恶意网站信息列表;数据清洗模块的功能是利用大数据技术将采集到的数据进行清洗降噪,去除残缺数据、错误数据和重复数据;数据格式化模块的功能是将采集到的数据进行格式化,以统一格式进行存储,例如:统一使用文本格式数据,例如:统一使用XML格式数据,例如:统一使用JSON格式数据,统一数据格式为方便大数据处理的数据类型,并且对字段进行规整;数据挖掘器的关联分析模块将...
【专利技术属性】
技术研发人员:林飞,程红,赵喜荣,梁浩,毛俊,
申请(专利权)人:北京亚鸿世纪科技发展有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。