一种基于网站特征的贷款类诈骗网站的识别方法技术

技术编号:25690301 阅读:36 留言:0更新日期:2020-09-18 21:02
本发明专利技术提供一种基于网站特征的贷款类诈骗网站的识别方法,包括:识别IP归属地,并筛选出IP地址为非中国大陆的网站;对筛选出的网站的HTML进行解析,提取手机端网页特征,筛选出手机端的网站;在筛选出的手机端的网站中再筛选出有中文编码的网站;对筛选出有中文编码的网站的文案字符进行分词;利用关键词库,对分词的结果进行聚类,计算命中词汇的权重;筛选出权重较高的网站。针对同类型不同网站的共同特征,针对贷款类诈骗网站,本发明专利技术形成了成熟的识别模型,可以快速、准确、有效的从大量网站中识别出贷款类诈骗网站,主动发现可能让网民蒙受损失的贷款类诈骗网站,为充分、及时的打击贷款类网络诈骗提供有效的支持。

【技术实现步骤摘要】
一种基于网站特征的贷款类诈骗网站的识别方法
本专利技术属于通讯
,尤其涉及一种基于网站特征的贷款类诈骗网站的识别方法。
技术介绍
随着互联网日新月异的发展,网络诈骗的手段也层出不穷,对网民造成了大量的经济损失,为社会带来了严重的不良影响。网络诈骗分子通过搭建虚假的贷款网站,引诱有贷款需求的网民,再通过技术手段,在网站中层层设套,从而骗取网民财产。现有的主流的技术手段是搭建举报平台或者情报收集平台,当网民发现被骗后可以通过此类平台进行举报,虽然是一个非常好的渠道,可以集合大量网民的力量发现网站,但是,此类平台欠缺主动发现诈骗网站的能力,而且得到的消息一般比较滞后。
技术实现思路
为解决上述技术问题,本专利技术提供一种基于网站特征的贷款类诈骗网站的识别方法。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。本专利技术采用如下技术方案:本文档来自技高网...

【技术保护点】
1.一种基于网站特征的贷款类诈骗网站的识别方法,其特征在于,包括:/n识别IP归属地,并筛选出IP地址为非中国大陆的网站;/n对筛选出的网站的HTML进行解析,提取手机端网页特征,筛选出手机端的网站;/n在筛选出的手机端的网站中再筛选出有中文编码的网站;/n对筛选出有中文编码的网站的文案字符进行分词;/n利用关键词库,对分词的结果进行聚类,计算命中词汇的权重;/n筛选出权重较高的网站。/n

【技术特征摘要】
1.一种基于网站特征的贷款类诈骗网站的识别方法,其特征在于,包括:
识别IP归属地,并筛选出IP地址为非中国大陆的网站;
对筛选出的网站的HTML进行解析,提取手机端网页特征,筛选出手机端的网站;
在筛选出的手机端的网站中再筛选出有中文编码的网站;
对筛选出有中文编码的网站的文案字符进行分词;
利用关键词库,对分词的结果进行聚类,计算命中词汇的权重;
筛选出权重较高的网站。


2.根据权利要求1所述的一种基于网站特征的贷款类诈骗网站的识别方法,其特征在于,在筛选出的手机端的网站中再筛选出有中文编码的网站的过程包括:
去除筛选出的手机端网站HTML的标签,提取全部文案字符;
对提取出的文案字符进行...

【专利技术属性】
技术研发人员:马敏燕沈颖彦张震陈形王蓓陈浏天胡少杰陈恒超仇晨悦季莹莹马骏野
申请(专利权)人:国家计算机网络与信息安全管理中心浙江分中心
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1