【技术实现步骤摘要】
一种基于网站特征的贷款类诈骗网站的识别方法
本专利技术属于通讯
,尤其涉及一种基于网站特征的贷款类诈骗网站的识别方法。
技术介绍
随着互联网日新月异的发展,网络诈骗的手段也层出不穷,对网民造成了大量的经济损失,为社会带来了严重的不良影响。网络诈骗分子通过搭建虚假的贷款网站,引诱有贷款需求的网民,再通过技术手段,在网站中层层设套,从而骗取网民财产。现有的主流的技术手段是搭建举报平台或者情报收集平台,当网民发现被骗后可以通过此类平台进行举报,虽然是一个非常好的渠道,可以集合大量网民的力量发现网站,但是,此类平台欠缺主动发现诈骗网站的能力,而且得到的消息一般比较滞后。
技术实现思路
为解决上述技术问题,本专利技术提供一种基于网站特征的贷款类诈骗网站的识别方法。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。本专利技术采用如 ...
【技术保护点】
1.一种基于网站特征的贷款类诈骗网站的识别方法,其特征在于,包括:/n识别IP归属地,并筛选出IP地址为非中国大陆的网站;/n对筛选出的网站的HTML进行解析,提取手机端网页特征,筛选出手机端的网站;/n在筛选出的手机端的网站中再筛选出有中文编码的网站;/n对筛选出有中文编码的网站的文案字符进行分词;/n利用关键词库,对分词的结果进行聚类,计算命中词汇的权重;/n筛选出权重较高的网站。/n
【技术特征摘要】
1.一种基于网站特征的贷款类诈骗网站的识别方法,其特征在于,包括:
识别IP归属地,并筛选出IP地址为非中国大陆的网站;
对筛选出的网站的HTML进行解析,提取手机端网页特征,筛选出手机端的网站;
在筛选出的手机端的网站中再筛选出有中文编码的网站;
对筛选出有中文编码的网站的文案字符进行分词;
利用关键词库,对分词的结果进行聚类,计算命中词汇的权重;
筛选出权重较高的网站。
2.根据权利要求1所述的一种基于网站特征的贷款类诈骗网站的识别方法,其特征在于,在筛选出的手机端的网站中再筛选出有中文编码的网站的过程包括:
去除筛选出的手机端网站HTML的标签,提取全部文案字符;
对提取出的文案字符进行...
【专利技术属性】
技术研发人员:马敏燕,沈颖彦,张震,陈形,王蓓,陈浏天,胡少杰,陈恒超,仇晨悦,季莹莹,马骏野,
申请(专利权)人:国家计算机网络与信息安全管理中心浙江分中心,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。