站点评估方法、装置、电子设备、存储介质和程序产品制造方法及图纸

技术编号:31313035 阅读:15 留言:0更新日期:2021-12-12 21:49
本公开提供了一种站点评估方法、装置、电子设备、存储介质和程序产品,涉及网络安全领域和内容推荐领域,可应用于站点链接抓取和站点库维护场景。该方法包括:获取与站点相关联的因特网协议地址集合;确定与因特网协议地址集合相关联的地域特征集合,地域特征集合中的地域特征指示与站点相关联的服务器所处的地理位置;以及基于地域特征集合来确定站点是否属于不良站点。利用上述方法,可以基于与站点相关联的因特网协议地址来判断站点是否属于不良站点,从而可以降低判断不良站点的成本,因此能够提高站点链接抓取和站点库维护的质量和效率。量和效率。量和效率。

【技术实现步骤摘要】
站点评估方法、装置、电子设备、存储介质和程序产品


[0001]本公开涉及网络安全领域和内容推荐领域,可应用于站点链接抓取和站点库维护场景,并且更具体地,涉及站点评估方法、站点评估装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]在因特网上每天都会新增数以万记甚至更多的域名,站点的新生和消逝则更是在频繁的交替中。面对普通网民来说,对于存在数年甚至数十年的知名站点通常难以感知到它们的生存周期,但针对因特网而言,对站点的存在记忆则是短暂的。随着创建和维护站点技术的快速发展,一些人会批量创建站点,采取多线条并进的方式进行黑灰产的资源生产,并且为了逃避管控也经常会通过频繁的更换站点来提供服务。这些站点通常包括无价值的垃圾内容以及不良内容,因此也会被称为不良站点。如果放任这些不良站点进入正常因特网生态中并展现在大众的视野当中,不仅会降低用户对因特网的体验,还会在一定程度上助长不良信息的传播。同时,如果站点库中包括过多的不良站点也会严重影响用户的查询体验。
[0003]然而,传统的用于站点评估的技术无法高质量和高效地解决上述问题。

技术实现思路

[0004]根据本公开的实施例,提供了一种站点评估方法、站点评估装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]在本公开的第一方面中,提供了一种站点评估方法,包括:获取与站点相关联的因特网协议地址集合;确定与因特网协议地址集合相关联的地域特征集合,地域特征集合中的地域特征指示与站点相关联的服务器所处的地理位置;以及基于地域特征集合来确定站点是否属于不良站点。
[0006]在本公开的第二方面中,提供了一种站点评估装置,包括:第一获取模块,被配置为获取与站点相关联的因特网协议地址集合;第一确定模块,被配置为确定与因特网协议地址集合相关联的地域特征集合,地域特征集合中的地域特征指示与站点相关联的服务器所处的地理位置;以及第二确定模块,被配置为基于地域特征集合来确定站点是否属于不良站点。
[0007]在本公开的第三方面中,提供了一种电子设备,包括至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够实现根据本公开的第一方面的方法。
[0008]在本公开的第四方面中,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机实现根据本公开的第一方面的方法。
[0009]在本公开的第五方面中,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时,执行根据本公开的第一方面的方法。
[0010]利用根据本申请的技术,提供了一种站点评估方法,利用该方法的技术方案,可以基于与站点相关联的因特网协议地址来判断站点是否属于不良站点,从而可以降低判断不良站点的成本,因此能够提高站点链接抓取和站点库维护的质量和效率。
[0011]应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
[0012]通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中在本公开示例性实施例中,相同的参考标号通常代表相同部件。应当理解,附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1示出了可以在其中实现本公开的某些实施例中的站点评估方法的站点评估环境100的示意性框图;
[0014]图2示出了根据本公开实施例的站点评估方法200的流程图;
[0015]图3示出了根据本公开实施例的站点评估方法300的流程图;
[0016]图4示出了根据本公开的实施例的站点评估装置400的示意性框图;以及
[0017]图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。
[0018]在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
[0019]下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0020]在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0021]如以上在
技术介绍
中所描述的,传统的用于站点评估的技术无法高质量和高效地解决上述问题。具体而言,在传统方案中,采用的是纯基于分类模型的方法。使用分类模型来进行站点评估实质上是基于站点中所包括的内容,为此,针对每个站点,可能需要从中提取十条、百条甚至更多条信息来支持使用分类模型进行站点评估。因此,如果需要针对因特网中的30亿个站点进行站点评估,就可能需要针对300

3000亿条信息使用分类模型来进行判断。由此可见,传统的用于站点评估的技术效率较低。同时,由于从站点提取的信息的形式和内容分类非常多并且相互之间的区别很大,因此分类模型在评估站点时也会存在质量上的问题。
[0022]为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个问题,考虑到大部分旨在生产垃圾内容以及不良内容的人所掌控的站点都具有一定的特征,本申请提出
了一种站点评估方法,利用该方法的技术方案,可以基于与站点相关联的因特网协议地址来判断站点是否属于不良站点,从而可以降低判断不良站点的成本,因此能够提高站点链接抓取和站点库维护的质量和效率。
[0023]图1示出了可以在其中实现本公开的某些实施例中的站点评估方法的站点评估环境100的示意性框图。根据本公开的一个或多个实施例,站点评估环境100可以是云环境。如图1中所示,站点评估环境100包括计算设备110。在站点评估环境100中,评估相关数据120作为计算设备110的输入被提供给计算设备110。评估相关数据120例如可以包括站点的域名或者与站点相关联的因特网协议地址集合。根据本公开的一个或多个实施例,针对同一站点在不同时间查询与站点相关联的因特网协议地址可能会得到不同的因特网协议地址。因此,可以在预定时间段内多次针对同一站点获取与该站点相关联的因特网协议地址,从而形成因特网协议地址集合。因特网协议地址集合中可以包括一个或多个因特网协议地址。
[0024]在获取了与站点相关联的因特网协议地址集合之后,计算设备110可以确定与因特网协议地址集合相关联的地域特征集合。根据本公开的一个或多个实施例,地域特征集合中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种站点评估方法,包括:获取与站点相关联的因特网协议地址集合;确定与所述因特网协议地址集合相关联的地域特征集合,所述地域特征集合中的地域特征指示与所述站点相关联的服务器所处的地理位置;以及基于所述地域特征集合来确定所述站点是否属于不良站点。2.根据权利要求1所述的方法,其中确定所述地域特征集合包括:获取对应关系表,所述对应关系表指示地理位置与因特网协议地址范围之间的对应关系;以及基于所述对应关系表来确定所述地域特征集合。3.根据权利要求1所述的方法,其中确定所述站点是否属于所述不良站点包括:如果所述地域特征集合中的地域特征所指示的地理位置均为国内地理位置,则确定所述站点不属于所述不良站点。4.根据权利要求1所述的方法,其中确定所述站点是否属于所述不良站点包括:确定所述地域特征集合中的地域特征所指示的地理位置包括国外地理位置;确定所述站点是否属于正常外文站点;以及如果确定所述站点属于所述正常外文站点,则确定所述站点不属于所述不良站点。5.根据权利要求4所述的方法,其中确定所述站点是否属于所述正常外文站点包括:获取与所述站点相关联的域名;以及基于所述域名来确定所述站点是否属于所述正常外文站点。6.根据权利要求5所述的方法,其中确定所述站点是否属于所述正常外文站点包括:基于所述域名来确定与所述站点相关联的国别;以及如果所述国别与所述国外地理位置匹配,则确定所述站点属于所述正常外文站点。7.根据权利要求4所述的方法,其中确定所述站点是否属于所述正常外文站点包括:确定所述站点所包括的中文内容与所述站点所包括的全部内容的比例;以及如果所述比例小于阈值比例,则确定所述站点属于所述正常外文站点。8.根据权利要求1所述的方法,其中确定所述站点是否属于所述不良站点包括:确定所述地域特征集合中的地域特征所指示的地理位置所包括的国外地理位置的数目;以及基于所述数目来确定所述站点是否属于所述不良站点。9.根据权利要求8所述的方法,其中确定所述站点是否属于所述不良站点包括:如果所述数目大于阈值数目,则确定所述站点属于所述不良站点。10.根据权利要求8所述的方法,其中确定所述站点是否属于所述不良站点包括:确定所述数目小于等于阈值数目;以及基于所述站点所包括的内容来确定所述站点是否属于所述不良站点。11.一种站点评估装置,包括:第一获取模块,被配置为获取与站点相关联的因特网协议地址集合;第一确定模块,被配置为确定与所述因特网协议地址集合相关联的地域特征集合,所述地域特征集合中的地域特征指示与所述站点相关联的服务器所处的地理位置;以及第二确定模块,被配置为基于所述地域特征集合来确定所述站点是否属于不良站点。
12.根据权利要求11所述的装置,其中所述第一确定模块包括:第二获取模块,被配置为获取对应关系表,所述对应关系表指示地理位置与因特网协议地址范围之间的对应关系;以...

【专利技术属性】
技术研发人员:王鹏刘伟余文利陈由之杨国强张博林赛群
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1