【技术实现步骤摘要】
一种异常行为网站的识别预警方法
[0001]本专利技术属于异常行为网站识别
,具体涉及一种异常行为网站的识别预警方法。
技术介绍
[0002]传统的异常行为网站预警识别方式是通过关键字进行匹配,统计某一网页出现的关键字种类和关键字出现的频次来进行识别预警,但传统的预警方式存在如下缺点:1、随着异常行为网站特征的增加,关键字库的不断扩大,容易产生预警误报;2、随着网络异常行为模式和手段的更新,仅依靠关键字库进行匹配不能紧跟网络异常行为的发展,容易产生漏报;3、仅用关键字单一维度对异常行为网站进行预警识别产生的预警数据缺乏说服力,需要人工再次核查与分析,预警识别自动化程度低。
[0003]由于传统的异常行为网站识别预警方法存在的缺点,导致其不能满足目前相关机关对于异常行为网站预警识别的使用需求。相关机关亟需一套更快速、更便捷、更精准、更智能的异常行为网站识别预警系统来及时发现互联网上的异常行为网站。
技术实现思路
[0004]为克服上述存在之不足,本专利技术的专利技术人通过长期的探索尝试以及多次的实 ...
【技术保护点】
【技术特征摘要】
1.一种异常行为网站的识别预警方法,其特征在于,其包括以下步骤:1)可疑网站线索识别:对互联网中的网站进行扫描,内容数据进行获取,通过常规的关键字匹配分析初步判断该网站是否为具有嫌疑的异常行为网站,对具有网络异常行为嫌疑的网站标注为目标网站;2)网站特征数据分析:对目标网站的特征数据进行获取和分析;3)经营主体信息分析:对目标网站关联的的经营主体进行相关数据分析;4)网络舆情数据分析:对目标网站和关联的经营主体所涉及的网络舆情进行数据分析;5)异常行为网站风险研判:对目标网站的特征数据分析、经营主体信息分析、网络舆情数据分析中涉及的各项风险评估网站的风险系数,对到达阈值的目标网站进行预警,对重点目标网站进行追踪监测。2.根据权利要求1所述的一种异常行为网站的识别预警方法,其特征在于,步骤1)中对互联网中的网站进行扫描采用基于Zmap技术的增强型分布式扫描采集技术,对网站的内容数据进行获取采用基于文本密度的Web正文抽取技术和基于OCR的网页文本内容提取技术。3.根据权利要求1所述的一种异常行为网站的识别预警方法,其特征在于,步骤2)中分析内容包括对目标网站进行程序指纹比对,分析目标网站的网络异常行为层级与价值收益体系的关系,分析网络异常行为的承载物相关信息。4.根据权利要求1所述的一种异常行为网站的识别预警方法,其特征在于,步骤3)包括对该企业的工商数据进行分析,对该企业的经营数据进行分析,对该企业的信用信息进行分析,对该企业的法人及高管信息进行分析。5.根据权利要求4所述的一种异常行为网站的识别预警方法,其特征在于,所述经营主体信息分析的具体操作为:根据目标网站的注册信息或备案信息,搜寻其经营主体信息,获取运营该目标网站的企业单位信息,然后分别制定工商数据异常指标库、经营数据异常指标库、信用信息异常指标库、法人高管异常指标库,分析各个指标库中数据是否...
【专利技术属性】
技术研发人员:胡起铭,张瑞冬,童永鳌,朱鹏,
申请(专利权)人:成都无糖信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。