【技术实现步骤摘要】
站点评估方法、装置、电子设备、存储介质和程序产品
[0001]本公开涉及网络安全领域和内容推荐领域,可应用于站点链接抓取和站点库维护场景,并且更具体地,涉及站点评估方法、站点评估装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]在因特网上每天都会新增数以万记甚至更多的域名,站点的新生和消逝则更是在频繁的交替中。面对普通网民来说,对于存在数年甚至数十年的知名站点通常难以感知到它们的生存周期,但针对因特网而言,对站点的存在记忆则是短暂的。随着创建和维护站点技术的快速发展,一些人会批量创建站点,采取多线条并进的方式进行黑灰产的资源生产,并且为了逃避管控也经常会通过频繁的更换站点来提供服务。这些站点通常包括无价值的垃圾内容以及不良内容,因此也会被称为不良站点。如果放任这些不良站点进入正常因特网生态中并展现在大众的视野当中,不仅会降低用户对因特网的体验,还会在一定程度上助长不良信息的传播。同时,如果站点库中包括过多的不良站点也会严重影响用户的查询体验。
[0003]然而,传统的用于站点评估的技术无法高质量和高效地解决上述问题。
技术实现思路
[0004]根据本公开的实施例,提供了一种站点评估方法、站点评估装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]在本公开的第一方面中,提供了一种站点评估方法,包括:获取与站点相关联的因特网协议地址集合;确定与因特网协议地址集合相关联的地域特征集合,地域特征集合中的地域特征指示与站点相关联的服务器所处的地理位置;以及 ...
【技术保护点】
【技术特征摘要】
1.一种站点评估方法,包括:获取与站点相关联的因特网协议地址集合;确定与所述因特网协议地址集合相关联的地域特征集合,所述地域特征集合中的地域特征指示与所述站点相关联的服务器所处的地理位置;以及基于所述地域特征集合来确定所述站点是否属于不良站点。2.根据权利要求1所述的方法,其中确定所述地域特征集合包括:获取对应关系表,所述对应关系表指示地理位置与因特网协议地址范围之间的对应关系;以及基于所述对应关系表来确定所述地域特征集合。3.根据权利要求1所述的方法,其中确定所述站点是否属于所述不良站点包括:如果所述地域特征集合中的地域特征所指示的地理位置均为国内地理位置,则确定所述站点不属于所述不良站点。4.根据权利要求1所述的方法,其中确定所述站点是否属于所述不良站点包括:确定所述地域特征集合中的地域特征所指示的地理位置包括国外地理位置;确定所述站点是否属于正常外文站点;以及如果确定所述站点属于所述正常外文站点,则确定所述站点不属于所述不良站点。5.根据权利要求4所述的方法,其中确定所述站点是否属于所述正常外文站点包括:获取与所述站点相关联的域名;以及基于所述域名来确定所述站点是否属于所述正常外文站点。6.根据权利要求5所述的方法,其中确定所述站点是否属于所述正常外文站点包括:基于所述域名来确定与所述站点相关联的国别;以及如果所述国别与所述国外地理位置匹配,则确定所述站点属于所述正常外文站点。7.根据权利要求4所述的方法,其中确定所述站点是否属于所述正常外文站点包括:确定所述站点所包括的中文内容与所述站点所包括的全部内容的比例;以及如果所述比例小于阈值比例,则确定所述站点属于所述正常外文站点。8.根据权利要求1所述的方法,其中确定所述站点是否属于所述不良站点包括:确定所述地域特征集合中的地域特征所指示的地理位置所包括的国外地理位置的数目;以及基于所述数目来确定所述站点是否属于所述不良站点。9.根据权利要求8所述的方法,其中确定所述站点是否属于所述不良站点包括:如果所述数目大于阈值数目,则确定所述站点属于所述不良站点。10.根据权利要求8所述的方法,其中确定所述站点是否属于所述不良站点包括:确定所述数目小于等于阈值数目;以及基于所述站点所包括的内容来确定所述站点是否属于所述不良站点。11.一种站点评估装置,包括:第一获取模块,被配置为获取与站点相关联的因特网协议地址集合;第一确定模块,被配置为确定与所述因特网协议地址集合相关联的地域特征集合,所述地域特征集合中的地域特征指示与所述站点相关联的服务器所处的地理位置;以及第二确定模块,被配置为基于所述地域特征集合来确定所述站点是否属于不良站点。
12.根据权利要求11所述的装置,其中所述第一确定模块包括:第二获取模块,被配置为获取对应关系表,所述对应关系表指示地理位置与因特网协议地址范围之间的对应关系;以...
【专利技术属性】
技术研发人员:王鹏,刘伟,余文利,陈由之,杨国强,张博,林赛群,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。