一种基于模拟访问的网站风险评估方法、装置及可存储介质制造方法及图纸

技术编号:39058888 阅读:13 留言:0更新日期:2023-10-12 19:51
本发明专利技术涉及网站风险评估技术领域,具体是一种基于模拟访问的网站风险评估方法、装置及可存储介质,包括以下步骤:S1.参数构造与数据采集:了解目标网站的参数信息,随后根据这些信息用模拟访问网站技术构造请求参数,而后再将构造的请求参数输入请求工具,随后操作请求工具启动,向目标网站发生请求,从而获取采集网站页面的数据,同时根据以往网站的风险信息数据构建敏感词数据库,且通过计算机算法设计查询与提取程序;本发明专利技术所设计的网站风险评估方法通过模拟访问网站技术建立,可以通过程序模拟人类用户的行为,自动化地访问目标网站,并且获取目标数据,从而大幅度提高效率,并且避免了手动操作的繁琐和误差,降低了对人力的需求。需求。需求。

【技术实现步骤摘要】
一种基于模拟访问的网站风险评估方法、装置及可存储介质


[0001]本专利技术涉及网站风险评估
,具体是一种基于模拟访问的网站风险评估方法、装置及可存储介质。

技术介绍

[0002]随着互联网扁平化的发展,内容信息的分发和获取比以往更加便利,这也大大方便了违规信息的快速传播。这类信息的传播会造成难以估计的社会影响,甚至有可能影响国家的安定和谐。网站所有者可以随意更改网站页面的内容,发布任意形式的信息。论坛、博客、社交产品等web2.0的网站可以让普通用户随意发布UGC内容。安全防控做得不到位的网站页面内容还可能被黑客随意篡改,甚至安装木马病毒。综上,网站页面内容的生成方式多种多样,内容发布者也是形形色色,其中就会有不少不法分子利用网络传播违规信息以达到非法牟利等非法目的,为了净化云平台以及维护网络环境的安全和稳定,对云上网站中存在的各类违规内容进行治理成为了意义重大又迫在眉睫的问题。
[0003]中国专利号CN110868383A提供一种网站风险评估方法、装置、电子设备及存储介质。该方法包括:采集与目标网站关联的一个或多个威胁情报信息及一个或多个安全事件信息;确定每个威胁情报信息的第一风险等级及第一影响范围等级;确定每个安全事件信息的第二风险等级及第二影响范围等级;根据所述第一风险等级,第一影响范围等级、第二风险等级、第二影响范围等级确定所述目标网站的风险评分。
[0004]网站风险值评估方法较为复杂,主要通过深度学习算法检测网页中是否包含了特定类型的违规内容,在检测过程中需要耗费较多的人力,且需要检测员需要频繁的手动操作的繁琐,增大了检测员的劳动量,而且检测员长时间劳作易使得评估数据出现误差,因此亟需研发一种基于模拟访问的网站风险评估方法、装置及可存储介质。

技术实现思路

[0005]本专利技术的目的在于提供一种基于模拟访问的网站风险评估方法、装置及可存储介质,以解决上述
技术介绍
中提出的网站风险值评估方法较为复杂,主要通过深度学习算法检测网页中是否包含了特定类型的违规内容,在检测过程中需要耗费较多的人力,且需要检测员需要频繁的手动操作的繁琐,增大了检测员的劳动量,而且检测员长时间劳作易使得评估数据出现误差的问题。
[0006]本专利技术的技术方案是:一种基于模拟访问的网站风险评估方法,包括以下步骤:
[0007]S1.参数构造与数据采集:了解目标网站的参数信息,随后根据这些信息用模拟访问网站技术构造请求参数,而后再将构造的请求参数输入请求工具,随后操作请求工具启动,向目标网站发生请求,从而获取采集网站页面的数据,同时根据以往网站的风险信息数据构建敏感词数据库,且通过计算机算法设计查询与提取程序;
[0008]S2.数据分析与评估:对获取的目标网站页面的数据进行解析,而后提取出需要的数据,并将提取出的数据用风险计算公式进行计算,可得到目标网站的风险评分;
[0009]S3.网站评估与风险记录:根据上述步骤得到的风险评分对网站的安全进行评估,以确定网站风险的等级,且此过程对评估的数据进行记录存储。
[0010]作为优选方案,所述S1中参数信息包括URL地址、请求方式、请求头、请求参数等信息。
[0011]作为优选方案,所述S1中的请求工具主要有两种,分别为Python中的requests库和Selenium框架,且其中requests库适用于静态页面抓取,而Selenium框架适用于动态页面抓取。
[0012]作为优选方案,所述S2中通过数据分析和可视化工具对数据分析和可视化,所述提取数据时查询程序通过遍历算法对数据进行查询,且通过关键字提取技术对数据进行提取。
[0013]作为优选方案,所述S2中的风险计算公式如下所示:
[0014][0015]其中,S为风险概率,N为查询程序查询的敏感词种类个数,M为以往网站的敏感词数据种类总数,K为查询程序查询的带有敏感词的数据总个数,L为目标网站的信息数据个数。
[0016]作为优选方案,所述S3网站风险的等级根据风险概率S进行设置,且风险概率S根据网站的不同类别相应的进行改动。
[0017]一种基于模拟访问的网站风险评估装置,包括模拟访问单元、数据分析和可视化工具、查询与提取程序、计算机设备及可存储介质,所述计算机设备为现有台式电脑,所述模拟访问单元安装在计算机上,所述模拟访问单元基于模拟访问网站技术建立,且采用Python、Java、JavaScript计算机语言进行编写。
[0018]作为优选方案,所述查询与提取程序安装在计算机设备上,所述查询与提取程序通过Python语言编写。
[0019]作为优选方案,所述数据分析工具有Python中的pandas库和numpy库,可视化工具有Python中的matplotlib库和seaborn库。
[0020]一种基于模拟访问的网站风险评估数据可存储介质,包括硬件设备与云数据平台,所述硬件设备为硬盘,且安装在计算机设备上,所述硬件设备存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个计算机设备上的处理器执行,所述云数据平台为华为云、百度云、腾讯云、闪存中的一种。
[0021]本专利技术通过改进在此提供一种基于模拟访问的网站风险评估方法、装置及可存储介质,与现有技术相比,具有如下改进及优点:
[0022](1)本专利技术所设计的网站风险评估方法通过模拟访问网站技术建立,可以通过程序模拟人类用户的行为,自动化地访问目标网站,并且获取目标数据,从而大幅度提高效率,并且避免了手动操作的繁琐和误差,降低了对人力的需求;
[0023](2)本专利技术所设计的风险计算公式,风险计算公式较为简洁,可以降低风险评估时的计算量,有利于提高计算速度,快速实现对网站的分析与风险评估,方便及时发现问题进行处理。
[0024](3)本专利技术所设计的评估方法通过模拟访问网站抓取数据,可以获得海量的有用信息,并进行进一步的分析和应用可以得到精确度较高的网站风险评估,提高了风险评估的全面性和准确性。
附图说明
[0025]下面结合附图和实施例对本专利技术作进一步解释:
[0026]图1是本专利技术的方法图。
具体实施方式
[0027]下面将结合附图1对本专利技术进行详细说明,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0029]本专利技术通过改进在此提供一种基于模拟访问的网站风险评估方法,如图1所示,包括以下步骤:
[0030]S本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于模拟访问的网站风险评估方法,其特征在于:包括以下步骤:S1.参数构造与数据采集:了解目标网站的参数信息,随后根据这些信息用模拟访问网站技术构造请求参数,而后再将构造的请求参数输入请求工具,随后操作请求工具启动,向目标网站发生请求,从而获取采集网站页面的数据,同时根据以往网站的风险信息数据构建敏感词数据库,且通过计算机算法设计查询与提取程序;S2.数据分析与评估:对获取的目标网站页面的数据进行解析,而后提取出需要的数据,并将提取出的数据用风险计算公式进行计算,可得到目标网站的风险评分;S3.网站评估与风险记录:根据上述步骤得到的风险评分对网站的安全进行评估,以确定网站风险的等级,且此过程对评估的数据进行记录存储。2.根据权利要求1所述的一种基于模拟访问的网站风险评估方法,其特征在于:所述S1中参数信息包括URL地址、请求方式、请求头、请求参数等信息。3.根据权利要求1所述的一种基于模拟访问的网站风险评估方法,其特征在于:所述S1中的请求工具主要有两种,分别为Python中的requests库和Selenium框架,且其中requests库适用于静态页面抓取,而Selenium框架适用于动态页面抓取。4.根据权利要求1所述的一种基于模拟访问的网站风险评估方法,其特征在于:所述S2中通过数据分析和可视化工具对数据分析和可视化,所述提取数据时查询程序通过遍历算法对数据进行查询,且通过关键字提取技术对数据进行提取。5.根据权利要求1所述的一种基于模拟访问的网站风险评估方法,其特征在于:所述S2中的风险计算公式如下所示:其中,S为风险概率,N为查询程序查询的敏感词种类个数,M为以往网站的...

【专利技术属性】
技术研发人员:张婷张欢钟承峰候小华
申请(专利权)人:广州百蕴启辰科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1