一种误报检测的方法以及系统技术方案

技术编号:18208494 阅读:42 留言:0更新日期:2018-06-13 08:12
本发明专利技术实施例提供了一种误报检测的方法以及系统,其中所述方法包括:接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;基于所述标识信息,获取所述危险网站的多维特征信息;结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。本发明专利技术实施例可以提高了误报检测的准确率,并进一步提升了恶意网站检测的准确率,保证了网络安全。

【技术实现步骤摘要】
一种误报检测的方法以及系统
本专利技术涉及数据处理的
,特别是涉及一种误报检测的方法和一种误报检测的系统。
技术介绍
随着互联网技术的发展,用户可以通过浏览器进行银行账户查询、网上购物、电子商务等操作,但用户在上网冲浪浏览网页的同时,也经常会遭遇到如钓鱼网站的等恶意网站的攻击。在具体实现中,可以通过安全软件对恶意网站进行识别,但安全网站的识别结果可能会存在误报的情况。误报是指本地引擎将正常的网站识别为恶意网站的现象,在相关技术中,通常采用人工反馈误报的方式发现误报,但这种人工反馈的方式时效性较低。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种误报检测的方法和相应的一种误报检测的系统。依据本专利技术的一个方面,提供了一种误报检测的方法,所述方法包括:接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;基于所述标识信息,获取所述危险网站的多维特征信息;结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。可选地,所述特征信息包括多维的特征信息,所述结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果的步骤包括:确定符合误报规则的特征信息;获取所述符合误报规则的特征信息的数量或者比例;若所述数量大于或等于第一预设阈值和/或所述比例大于或等于第二预设阈值,则判定所述识别结果信息为误报的识别结果;若所述数量小于第一预设阈值和/或所述比例小于第二预设阈值,则判定所述识别结果信息不为误报的识别结果。可选地,所述特征信息包括属性信息;所述确定符合误报规则的特征信息的步骤包括:判断所述标识信息和/或所述属性信息是否在预置的白名单列表中;若是,则判定所述标识信息和/或所述属性信息符合误报规则;若否,则判定所述标识信息和/或所述属性信息不符合误报规则。可选地,所述标识信息包括URL信息,所述属性信息包括如下信息的至少一种:所述危险网站的网络内容服务商ICP备案信息、WHOIS信息;所述判断所述标识信息和/或所述属性信息是否在预置的白名单列表中的步骤包括:判断所述ICP备案信息是否在预置的ICP备案白名单列表中;和/或,判断所述WHOIS信息是否在预置的WHOIS注册白名单列表中;和/或,判断所述URL信息是否在预置的网址白名单列表中。可选地,所述特征信息包括统计信息;所述确定符合误报规则的特征信息的步骤包括:根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则。可选地,所述统计信息包括如下信息的至少一种:所述危险网站的页面浏览量和/或独立访客量;所述危险网站的服务器IP地址下的黑站数量和/或黑站比例;所述危险网站的子站数量和/或URL数量;所述危险网站中进入搜索引擎的实际记录数;获取WHOIS注册时间后,计算的所述WHOIS注册时间距离当前时间的注册时长。可选地,所述根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则的步骤包括:若所述页面浏览量大于预设浏览量阈值,和/或,所述独立访客量大于预设独立访客量阈值,则判定所述统计信息符合误报规则;和/或,当所述服务器IP地址下的黑站数量小于预设黑站数量阈值,和/或,所述黑站比例小于预设比例值,则判定所述统计信息符合误报规则;和/或,当所述子站数量大于预设的子站阈值,和/或,所述URL数量大于预设的URL阈值,则判定所述统计信息符合误报规则;和/或,当所述进入搜索引擎的实际记录数大于预设的记录数阈值,则判定所述统计信息符合误报规则;和/或,若所述注册时长大于预设的时间阈值,则判定所述统计信息符合误报规则。可选地,所述识别引擎位于客户端和/或服务器端;所述方法还包括:向所述客户端和/或服务器端返回检测结果,所述检测结果包括第一检测结果或者第二检测结果,所述第一检测结果为判定所述识别结果信息为误报的识别结果时生成的检测结果;所述第二检测结果为判定所述识别结果信息不为误报的识别结果时生成的检测结果。可选地,所述危险网站包括如下网站的至少一种:钓鱼网站、挂载有挖矿脚本的网站、挂载了木马的网站。依据本专利技术的另一个方面,提供了一种误报检测的系统,所述系统包括:识别结果信息接收模块,适于接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;特征信息获取模块,适于基于所述标识信息,获取所述危险网站的多维特征信息;误报判断模块,适于结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。可选地,所述特征信息包括多维的特征信息,所述误报判断模块包括:符合误报规则的特征信息确定子模块,适于确定符合误报规则的特征信息;判定子模块,适于获取所述符合误报规则的特征信息的数量或者比例;若所述数量大于或等于第一预设阈值和/或所述比例大于或等于第二预设阈值,则判定所述识别结果信息为误报的识别结果;若所述数量小于第一预设阈值和/或所述比例小于第二预设阈值,则判定所述识别结果信息不为误报的识别结果。可选地,所述特征信息包括属性信息;所述符合误报规则的特征信息确定子模块包括:白名单判断单元,适于判断所述标识信息和/或所述属性信息是否在预置的白名单列表中;若是,则判定所述标识信息和/或所述属性信息符合误报规则;若否,则判定所述标识信息和/或所述属性信息不符合误报规则。可选地,所述标识信息包括URL信息,所述属性信息包括如下信息的至少一种:所述危险网站的网络内容服务商ICP备案信息、WHOIS信息;所述白名单判断单元还适于:判断所述ICP备案信息是否在预置的ICP备案白名单列表中;和/或,判断所述WHOIS信息是否在预置的WHOIS注册白名单列表中;和/或,判断所述URL信息是否在预置的网址白名单列表中。可选地,所述特征信息包括统计信息;所述符合误报规则的特征信息确定子模块包括:统计信息判断单元,适于根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则。可选地,所述统计信息包括如下信息的至少一种:所述危险网站的页面浏览量和/或独立访客量;所述危险网站的服务器IP地址下的黑站数量和/或黑站比例;所述危险网站的子站数量和/或URL数量;所述危险网站中进入搜索引擎的实际记录数;获取WHOIS注册时间后,计算的所述WHOIS注册时间距离当前时间的注册时长。可选地,所述统计信息判断单元还适于:若所述页面浏览量大于预设浏览量阈值,和/或,所述独立访客量大于预设独立访客量阈值,则判定所述统计信息符合误报规则;和/或,当所述服务器IP地址下的黑站数量小于预设黑站数量阈值,和/或,所述黑站比例小于预设比例值,则判定所述统计信息符合误报规则;和/或,当所述子站数量大于预设的子站阈值,和/或,所述URL数量大于预设的URL阈值,则判定所述统计信息符合误报规则;和/或,当所述进入搜索引擎的实际记录数大于预设的记录数阈值,则判定所述统计信息符合误报规则;和/或,若所述注册时长大于预设的时间阈值,则判定所述统计信息符合误报规则。可选地,所述识别引擎位于客户端和/或服务器端;所述系统还包括:检测结果返回模块,适于向所述客户端和/或服务器端返回检测结果,所本文档来自技高网...
一种误报检测的方法以及系统

【技术保护点】
一种误报检测的方法,所述方法包括:接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;基于所述标识信息,获取所述危险网站的多维特征信息;结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。

【技术特征摘要】
1.一种误报检测的方法,所述方法包括:接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;基于所述标识信息,获取所述危险网站的多维特征信息;结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。2.如权利要求1所述的方法,其特征在于,所述特征信息包括多维的特征信息,所述结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果的步骤包括:确定符合误报规则的特征信息;获取所述符合误报规则的特征信息的数量或者比例;若所述数量大于或等于第一预设阈值和/或所述比例大于或等于第二预设阈值,则判定所述识别结果信息为误报的识别结果;若所述数量小于第一预设阈值和/或所述比例小于第二预设阈值,则判定所述识别结果信息不为误报的识别结果。3.如权利要求1或2所述的方法,其特征在于,所述特征信息包括属性信息;所述确定符合误报规则的特征信息的步骤包括:判断所述标识信息和/或所述属性信息是否在预置的白名单列表中;若是,则判定所述标识信息和/或所述属性信息符合误报规则;若否,则判定所述标识信息和/或所述属性信息不符合误报规则。4.如权利要求3所述的方法,其特征在于,所述标识信息包括URL信息,所述属性信息包括如下信息的至少一种:所述危险网站的网络内容服务商ICP备案信息、WHOIS信息;所述判断所述标识信息和/或所述属性信息是否在预置的白名单列表中的步骤包括:判断所述ICP备案信息是否在预置的ICP备案白名单列表中;和/或,判断所述WHOIS信息是否在预置的WHOIS注册白名单列表中;和/或,判断所述URL信息是否在预置的网址白名单列表中。5.如权利要求1-4任一项所述的方法,其特征在于,所述特征信息包括统计信息;所述确定符合误报规则的特征信息的步骤包括:根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则。6.如权利要求5所述的方法,其特征在于,所述统计信息包括如下信息的至少一种:所述危险网站的...

【专利技术属性】
技术研发人员:尹露牛成李晓波
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1