一种恶意网站的检测方法、装置、设备及存储介质制造方法及图纸

技术编号:26763085 阅读:21 留言:0更新日期:2020-12-18 23:20
本申请公开了一种恶意网站的检测方法,包括:在目标网站的目标网页加载完成后,确定出目标网页的网页截图;根据网页截图中的采样点确定出目标网页的内容类型,并根据内容类型计算出目标网页的网页特征值;判断预先根据恶意网站确定出的特征值数据库中是否存在与网页特征值相似度达到预设阈值的目标特征值;若是,则确定出目标网站为恶意网站。本方法在能够降低对人力资源的消耗的基础上,提高检测恶意网站的准确度。本申请还公开了一种恶意网站的检测装置、设备及计算机可读存储介质,均具有上述有益效果。

【技术实现步骤摘要】
一种恶意网站的检测方法、装置、设备及存储介质
本专利技术涉及网站检测领域,特别涉及一种恶意网站的检测方法、装置、设备及计算机可读存储介质。
技术介绍
随着信息技术的快速发展,网络上存在大量的色情、赌博、诈骗、钓鱼、内容盗版等非法运营的恶意网站,并且在恶意网站被关停以后,其运营者只要克隆一次恶意网站的源代码,更换域名和服务器IP则又可以重新上线该网站。现有技术中,主要是利用服务端爬虫访问目标网站,获取目标网站的目标网页的网页内容,然后基于网页内容通过浏览器端渲染的方式进行识别,从而确定出该目标网站是否为恶意网站。但是,由于利用服务端爬虫获取网页内容时,一般只能获取到目标网页的网页框架,难以获取到目标网页中的文字图像等实质性内容,因此使得对目标网站是否为恶意网站的判断并不准确;并且恶意网站中往往设置有用于对抗服务端爬虫访问的技术,因此技术人员需要根据实际需求修改服务端爬虫的源代码,这又将造成对人力资源的极大消耗。因此,如何在能够降低对人力资源的消耗的基础上,提高检测恶意网站的准确度,是本领域技术人员目前需要解决的技术问题。<本文档来自技高网...

【技术保护点】
1.一种恶意网站的检测方法,其特征在于,包括:/n在目标网站的目标网页加载完成后,确定出所述目标网页的网页截图;/n根据所述网页截图中的采样点确定出所述目标网页的内容类型,并根据所述内容类型计算出所述目标网页的网页特征值;/n判断预先根据恶意网站确定出的特征值数据库中是否存在与所述网页特征值相似度达到预设阈值的目标特征值;/n若是,则确定出所述目标网站为恶意网站。/n

【技术特征摘要】
1.一种恶意网站的检测方法,其特征在于,包括:
在目标网站的目标网页加载完成后,确定出所述目标网页的网页截图;
根据所述网页截图中的采样点确定出所述目标网页的内容类型,并根据所述内容类型计算出所述目标网页的网页特征值;
判断预先根据恶意网站确定出的特征值数据库中是否存在与所述网页特征值相似度达到预设阈值的目标特征值;
若是,则确定出所述目标网站为恶意网站。


2.根据权利要求1所述的方法,其特征在于,所述根据所述网页截图中的采样点确定出所述目标网页的内容类型,并根据所述内容类型计算出所述目标网页的网页特征值的过程,具体包括:
计算出所述网页截图中的多个所述采样点的RGB值的RGB方差;
当所述RGB方差小于第一阈值时,确定出所述目标网页的所述内容类型为文本类型,根据所述目标网页中的特征文本计算出所述网页特征值;
当所述RGB方差大于第二阈值时,确定出所述目标网页的所述内容类型为图像类型,根据所述目标网页中的图像元素计算出所述网页特征值;
当同一所述采样点的RGB值在预设时间段内发生变化时,确定出所述目标网页的所述内容类型为视频类型,将所述目标网页转换为静态网页并计算出所述网页特征值。


3.根据权利要求2所述的方法,其特征在于,所述当所述RGB方差小于第一阈值时,确定出所述目标网页的所述内容类型为文本类型,根据所述目标网页中的特征文本计算出所述网页特征值的过程,具体包括:
当所述RGB方差小于所述第一阈值时,确定出所述目标网页的所述内容类型为所述文本类型;
提取所述目标网页中的所述特征文本,并按照预设规则为所述特征文本的各部分分别设置对应的权重;
根据所述特征文本和所述权重计算出所述网页特征值。


4.根据权利要求2所述的方法,其特征在于,所述当所述RGB方差大于第二阈值时,确定出所述目标网页的所述内容类型为图像类型,根据所述目标网页中的图像元素计算出所述网页特征值的过程,具体包括:
当所述RGB方差大于所述第二阈值时,确定出所述目标网页的所述内容类型为所述图像类型;
根据所述目标网页中的所述图像元素的像素点计算出第一特征值;
提取出所述图像元素中的文本信息,并根据所述文本信息计算出第二特征值;
根据所述第一特征值和所述第二特征值计算出与所述目标网页对应的网页特征值。

【专利技术属性】
技术研发人员:金相莉方平
申请(专利权)人:杭州安恒信息安全技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1