一种欺诈网站的检测方法技术

技术编号：15542485 阅读：40 留言：0更新日期：2017-06-05 11:24

本发明专利技术公开了一种欺诈网站的检测方法，它包括获取网站统一资源定位符URL，检查网站是否在已有的网站数据库，根据网站流量排名数值进行分类检查，检测的项目有：域名匹配和网站标题、网站页面内容、网站DOM文档对象模型、页面图片中的欺诈信息，获得各个对应的影响因子，将这些影响因子加权求和计算安全系数，并把安全系数与所设定的阈值比较，将待检测网站分为欺诈网站和可信网站两类，网站流量排名排后，则需要检查项目设置越多。本发明专利技术的优点：能既准确又快速地识别未记录在黑名单中的欺诈网站，还能合理分配系统资源。

Method for detecting fraudulent website

The invention discloses a method for detecting fraudulent website, which includes obtaining uniform resource locator website with URL, check whether the site in the existing website database, according to web traffic ranking numerical classification inspection, detection of the project are: domain name, website, website page title and content of the website, the DOM document object model, page pictures the fraudulent information, obtain the factors corresponding to each of these factors, the weighted sum to calculate the factor of safety, and the safety coefficient is compared with the threshold, the test site is divided into two types of fraudulent websites and trusted sites, site traffic rank, the more you need to check the project settings. The invention has the advantages that the fraudulent websites which are not recorded in the blacklist can be accurately and quickly identified, and the system resources can be reasonably allocated.

全部详细技术资料下载

【技术实现步骤摘要】
一种欺诈网站的检测方法
本专利技术涉及网络安全领域，尤其涉及一种含有欺诈信息网站的检测方法。
技术介绍
在信息技术飞速发展的今天，中国网民的数量的逐年增长，但对于大多数安全意识相对缺乏的网民来说，欺诈网站侵害人民财产安全是一个严重问题。网络欺诈，是指通过声称来自正规或知名机构等的欺骗性垃圾邮件或者仿照正规网站页面等方式，意图引诱收件人给出敏感信息（包括但不限于账号、密码、信用卡信息等）的一种攻击形式。欺诈网站可以是高度模仿真正网站骗取用户输入账号密码，也可以是含有中奖、博彩、虚假广告等欺诈信息的危害人民群众财产安全的网站。对于常见的黑名单过滤技术、利用收集欺诈网站作为数据库，然后使用其匹配新网页相似度从而判断欺诈网站的方法，无法有效辨识新类型的欺诈网站，同时又存在系统检测时资源分配不均匀的问题。因此，如何能够有效检测出未记录在黑名单中的欺诈网站，同时能够合理分配资源利用，从而达到避免或减少用户损失的目的，成为欺诈网站检测系统的重点所在。
技术实现思路
本专利技术所要解决的技术问题就是提供一种欺诈网站的检测方法，它能既准确又快速地识别未记录在黑名单中的欺诈网站，还能合理分配系统资源。本专利技术所要解决的技术问题是通过这样的技术方案实现的，它包括有以下步骤：步骤1、获取网站统一资源定位符URL；步骤2、根据获得的网站统一资源定位符URL在系统已有的网站数据库中匹配，网站URL不存在于数据库中，则执行步骤3；若网站存在于数据库中，则结束；步骤3、检测网站流量排名数值是否大于100万，若获得的网站排名数值大于100万，则执行步骤5；否则，则执行步骤4；步骤4、检测网站...
一种欺诈网站的检测方法

【技术保护点】
一种欺诈网站的检测方法，其特征是，包括以下步骤：步骤1、获取网站统一资源定位符URL；步骤2、根据获得的网站统一资源定位符URL在系统已有的网站数据库中匹配，网站URL不存在于数据库中，则执行步骤3；若网站存在于数据库中，则结束；步骤3、检测网站流量排名数值是否大于100万，若获得的网站排名数值大于100万，则执行步骤5；否则，则执行步骤4；步骤4、，检测网站流量排名数值是否大于10万，若获得的网站排名数值大于10万，则执行步骤6；若获得的网站排名数值小于10万，则执行步骤7；步骤5、通过获取的统一资源定位符URL经过检测域名是否匹配和检测网站标题、检测网站页面内容、检测网站DOM文档对象模型、检测页面图片中存在的欺诈信息，计算安全系数，返回安全系数的结果与所设定排名数值大于100万的阈值比较，将待检测网站分为欺诈网站和可信网站两类，然后执行步骤8；步骤6、通过检测网站页面内容、检测网站DOM文档对象模型，计算安全系数，返回安全系数的结果与所设定排名数值10万‑100万的阈值比较，将待检测网站分为欺诈网站和可信网站两类，然后执行步骤8；步骤7、通过检测网站页面内容，得到安全系数，返回安...

【技术特征摘要】
1.一种欺诈网站的检测方法，其特征是，包括以下步骤：步骤1、获取网站统一资源定位符URL；步骤2、根据获得的网站统一资源定位符URL在系统已有的网站数据库中匹配，网站URL不存在于数据库中，则执行步骤3；若网站存在于数据库中，则结束；步骤3、检测网站流量排名数值是否大于100万，若获得的网站排名数值大于100万，则执行步骤5；否则，则执行步骤4；步骤4、，检测网站流量排名数值是否大于10万，若获得的网站排名数值大于10万，则执行步骤6；若获得的网站排名数值小于10万，则执行步骤7；步骤5、通过获取的统一资源定位符URL经过检测域名是否匹配和检测网站标题、检测网站页面内容、检测网站DOM文档对象模型、检测页面图片中存在的欺诈信息，计算安全系数，返回安全系数的结果与所设定排名数值大于100万的阈值比较，将待检测网站分为欺诈网站和可信网站两类，然后执行步骤8；步骤6、通过检测网站页面内容、检测网站DOM文档对象模型，计算安全系数，返回安全系数的结果与所设定排名数值10万-100万的阈值比较，将待检测网站分为欺诈网站和可信网站两类，然后执行步骤8；步骤7、通过检测网站页面内容，得到安全系数，返回安全系数与所设定的排名数值小于10万的阈值比较，将待检测网站分为欺诈网站和可信网站两类，然后执行步骤8；步骤8、根据识别的结果更新网站数据库。2.根据权利要求1所述的欺诈网站的检测方法，其特征是，在步骤5中，判断待检测网站的步骤如下：步骤S201，检测网站域名与中网可信网站匹配和网站标题得到第一影响因子I1；步骤S202，获取所述URL对应网站页面的内容，对页面内容做敏感关键词及含有通配符的混淆敏感关键词匹配，根据页面含有敏感关键词和混淆敏感关键词的数量，将第二影响因子I2置为2,1或0；步骤S203，获取网站页面访问页面的源代码，利用正则表达式提取出DOM文档对象模型中的所有站外信息，将提取出的非本域名的URL进行网站流量排名检测，当排名数值超过100万的URL数量占提取出的总的URL的比例超过站外URL比例阈值时，将第三影响因子I3置1，否则置0；检测页面中所含有的信息输入框的数量及对应的名称，若含有信息输入框，同时信息输入框的名称为敏感词，则将第四影响...

【专利技术属性】
技术研发人员：刘岳，刘剑峰，盛杰，尹成语，杨吉云，
申请(专利权)人：重庆大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人