用于检测盗用链接的站点的方法和装置制造方法及图纸

技术编号:22238435 阅读:21 留言:0更新日期:2019-10-09 18:18
本申请实施例公开了用于检测盗用链接的站点的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取网络行为数据;对网络行为数据进行关键词特征和链接跳转特征提取,得到关键词和与关键词相关的链接跳转流;基于关键词和与关键词相关的链接跳转流、以及目标页面的预设授权站点集合,确定出链接跳转流包含的链接中未经目标页面授权的链接对应的站点,其中,目标页面为链接跳转流跳转至的页面。该实施方式能够实现链接盗用行为的监控。

Methods and devices for detecting sites that embezzle links

【技术实现步骤摘要】
用于检测盗用链接的站点的方法和装置
本申请实施例涉及计算机
,具体涉及网络数据处理方法,尤其涉及用于检测盗用链接的站点的方法和装置。
技术介绍
在互联网中,一些网站链接对链接安全性有较高的要求,例如银行网站的链接。这些网站通常会授权一些其他站点使用其链接,以便用户可以通过授权的站点提供的链接安全地跳转至这些网站。然而,这些网站链接经常会被一些未经授权的网站盗用,通过未经授权的网站访问时,安全性无法得到保证。
技术实现思路
本公开的实施例提出了用于检测盗用链接的站点的方法、装置、电子设备和计算机可读介质。第一方面,本公开的实施例提供了一种用于检测盗用链接的站点的方法,包括:获取网络行为数据;对网络行为数据进行关键词特征和链接跳转特征提取,得到关键词和与关键词相关的链接跳转流;基于关键词和与关键词相关的链接跳转流、以及目标页面的预设授权站点集合,确定出链接跳转流包含的链接中未经目标页面授权的链接对应的站点,其中,目标页面为链接跳转流跳转至的页面。在一些实施例中,上述基于关键词和与关键词相关的链接跳转流、以及目标页面的预设授权站点集合,确定出链接跳转流包含的链接中未经目标页面授权的链接对本文档来自技高网...

【技术保护点】
1.一种用于检测盗用链接的站点的方法,包括:获取网络行为数据;对所述网络行为数据进行关键词特征和链接跳转特征提取,得到关键词和与关键词相关的链接跳转流;基于所述关键词和与关键词相关的链接跳转流、以及目标页面的预设授权站点集合,确定出所述链接跳转流包含的链接中未经目标页面授权的链接对应的站点,其中,所述目标页面为所述链接跳转流跳转至的页面。

【技术特征摘要】
1.一种用于检测盗用链接的站点的方法,包括:获取网络行为数据;对所述网络行为数据进行关键词特征和链接跳转特征提取,得到关键词和与关键词相关的链接跳转流;基于所述关键词和与关键词相关的链接跳转流、以及目标页面的预设授权站点集合,确定出所述链接跳转流包含的链接中未经目标页面授权的链接对应的站点,其中,所述目标页面为所述链接跳转流跳转至的页面。2.根据权利要求1所述的方法,其中,所述基于所述关键词和与关键词相关的链接跳转流、以及目标页面的预设授权站点集合,确定出所述链接跳转流包含的链接中未经目标页面授权的链接对应的站点,包括:对所述关键词进行意图分析,确定出包含访问预设页面的意图的目标关键词;将与目标关键词相关的链接跳转流作为目标链接跳转流,确定所述目标链接跳转流跳转至的目标页面;基于所述目标链接跳转流、以及所述目标页面的预设授权站点集合,确定出所述链接跳转流包含的链接中未经目标页面授权的链接对应的站点。3.根据权利要求2所述的方法,其中,所述基于所述目标链接跳转流、以及所述目标页面的预设授权站点集合,确定出所述链接跳转流包含的链接中未经目标页面授权的链接对应的站点,包括:解析所述目标链接跳转流,得到目标链接跳转流包含的至少一个子链接;对所述子链接对应的站点进行数据爬取,根据爬取的数据确定所述子链接对应的站点是否包含所述目标链接跳转流所表征的链接跳转行为;响应于确定所述子链接对应的站点包含所述目标链接跳转流所表征的链接跳转行为,判断所述子链接对应的站点是否在所述目标页面的预设授权站点集合中;若所述子链接对应的站点不在所述目标页面的预设授权站点集合中,确定所述子链接为未经目标页面授权的链接。4.根据权利要求2或3所述的方法,其中,所述对所述关键词相关的网络行为进行意图分析,确定出包含访问预设页面的意图的目标关键词,包括:将提取出的关键词中,与预设的意图关键词集合中的意图关键词匹配成功的关键词作为目标关键词,其中,所述预设的意图关键词集合包括已确定的包含访问预设页面的意图的意图关键词。5.根据权利要求1所述的方法,其中,所述基于所述关键词和与关键词相关的链接跳转流、以及目标页面的预设授权站点集合,确定出所述链接跳转流包含的链接中未经目标页面授权的链接对应的站点,包括:响应于确定所述链接跳转流包含的链接对应的站点不在所述目标页面的预设授权站点集合中,将所述关键词和与关键词相关的链接跳转流输入已训练的识别模型中,识别出所述链接跳转流包含的链接中未经目标页面授权的链接对应的站点;其中,所述识别模型基于所述目标页面的已知未授权站点相关的关键词特征和链接跳转流特征训练得出。6.一种用于检测盗用链接的站点的装置,包括:获取单元,被配置为获取网络行为数据;提取单元,被配置为对所述网络行为数据进行关键词特征...

【专利技术属性】
技术研发人员:刘昊骋张梦许韩晨玺陈浩胡庆华
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1