一种网站自动化巡检方法技术

技术编号:39131492 阅读:7 留言:0更新日期:2023-10-23 14:50
本发明专利技术提供的一种网站自动化巡检方法,所述巡检方法包括:步骤S1:采用爬虫技术实现页面分析;步骤S2:基于步骤S1解析正常网页内容以及对页面截图,并对生成页面进行hash计算,获得计算结果;步骤S3:根据所述计算结果和历史页面对比分析,监测页面内容是否发生变化;步骤S4:对变化的页面进行内容质检,获得质检结果;步骤S5:根据所述质检结果,对有问题的页面进行片段标注;步骤S6:将所有问题结果进行生成巡检报告。全流程自动化巡检降低人工成本,提高监测评率,提升网站的服务质量,提高客户使用体验。户使用体验。户使用体验。

【技术实现步骤摘要】
一种网站自动化巡检方法


[0001]本专利技术涉及数据监管领域,尤其涉及一种网站自动化巡检方法。

技术介绍

[0002]随着互联网的飞速发展,各行各业要想获得更好的前景,就必须要开展线上业务,拓宽渠道。比如银行业与互联网高度融合后,传统银行业务拓展渠道、服务方式得以改变,银行业更面临着日趋激烈的竞争环境和不断攀升的客户期望。
[0003]银行网站建设是展现银行企业形象、产品和服务的窗口,通过银行网站银行与用户间没有了柜台的阻隔,通过网络使其相互间信息流通交流,一是方便用户了解信息行情对银行产生更大的信心、支持及忠诚度,另一方面银行也可及时了解到用户最新的反馈信息,增加其自身的决断力及竞争力。
[0004]由于官网网页偏多以及各个业务板块内容比较复杂,难免由于某些客观因素导致信息呈现上出现了偏差,网站管理员很难发现异常问题。所以为了发现问题以及及时的修正问题,急需一种网站自动化巡检的方法和装置,快速定位未响应页面问题以及页面存在潜在内容不规范问题。
[0005]当前管理员通过定时巡检或者客户反馈,发现网站是否正常访问问题,内容发布人员通过人工校验或者客户反馈解决内容异常问题。

技术实现思路

[0006]鉴于上述问题,提出了本专利技术以便提供克服上述问题或者至少部分地解决上述问题的一种网站自动化巡检方法。
[0007]根据本专利技术的一个方面,提供了一种网站自动化巡检方法,所述巡检方法包括:
[0008]步骤S1:采用爬虫技术实现页面分析;
[0009]步骤S2:基于步骤S1解析正常网页内容以及对页面截图,并对生成页面进行hash计算,获得计算结果;
[0010]步骤S3:根据所述计算结果和历史页面对比分析,监测页面内容是否发生变化;
[0011]步骤S4:对变化的页面进行内容质检,获得质检结果;
[0012]步骤S5:根据所述质检结果,对有问题的页面进行片段标注;
[0013]步骤S6:将所有问题结果进行生成巡检报告。
[0014]可选的,所述步骤S1:采用爬虫技术实现页面分析具体包括:根据网页url,分析所述页面的状态,并进行记录。
[0015]可选的,所述步骤S2:基于步骤S1解析正常网页内容以及对页面截图,并对生成页面进行hash计算,获得计算结果具体包括:
[0016]基于爬虫技术实现对页面内容分析,获取页面内内容;
[0017]并对页面进行HASH编码,用于历史内容的对比。
[0018]可选的,所述步骤S3:根据所述计算结果和历史页面对比分析,监测页面内容是否
发生变化具体包括:
[0019]采用md5值对比,快速定位变化的页面,其中,md5是一种信息摘要算法,一种被广泛使用的密码散列函数,产生出一个128位的散列值,用来确保信息传输完整一致性。
[0020]可选的,所述步骤S4:对变化的页面进行内容质检的范围包括:文字错误、语义错误、标点错误、金额和日期错误。
[0021]可选的,所述步骤S5:根据所述质检结果,对有问题的页面进行片段标注具体包括:
[0022]根据所述质检结果,对有问题的内容进行图像标记,为后续定位问题和解决问题做好参考依据。
[0023]可选的,所述步骤S6:将所有问题结果进行生成巡检报告具体包括:对步骤S1、步骤S4和步骤S5的结果进行整合,形成每个页面的巡检报告。
[0024]本专利技术提供的一种网站自动化巡检方法,所述巡检方法包括:步骤S1:采用爬虫技术实现页面分析;步骤S2:基于步骤S1解析正常网页内容以及对页面截图,并对生成页面进行hash计算,获得计算结果;步骤S3:根据所述计算结果和历史页面对比分析,监测页面内容是否发生变化;步骤S4:对变化的页面进行内容质检,获得质检结果;步骤S5:根据所述质检结果,对有问题的页面进行片段标注;步骤S6:将所有问题结果进行生成巡检报告。全流程自动化巡检可以降低人工成本,提高监测评率,提升网站的服务质量,提高客户使用体验。
[0025]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0026]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0027]图1为本专利技术实施例提供的一种网站自动化巡检方法的流程图;
[0028]图2为本专利技术实施例提供的纠错流程图;
[0029]图3为本专利技术实施例提供的页面结果截图示意图;
[0030]图4为本专利技术实施例提供的进行文本识别反向将结果标注回去,结果示意图。
具体实施方式
[0031]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0032]本专利技术的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
[0033]下面结合附图和实施例,对本专利技术的技术方案做进一步的详细描述。
[0034]如图1所示,一种网站自动化巡检的方法包括:
[0035]步骤S101:通过爬虫技术实现页面分析,根据网页url,分析所述页面的状态,并进行记录;
[0036]步骤S201:基于S1解析正常网页内容以及对该页面截图,并生成该页面进行hash计算;
[0037]步骤S301:基于S2获得的结果进行和历史页面对比分析,监测页面内容是否发生变化;
[0038]步骤S401:对变化的页面进行内容质检;
[0039]步骤S501:基于S4质检结果,对有问题的页面进行片段标注;
[0040]步骤S601:将所有问题结果进行生成巡检报告。
[0041]步骤S101中,基于爬虫技术实现对页面状态的自动分析。
[0042]步骤S201中,基于爬虫技术实现对页面内容分析,获取页面内内容,并对页面进行HASH编码,用于后续历史内容的对比。
[0043]步骤S301中,通过md5值对比,快速定位变化的页面,其中,md5是一种信息摘要算法(message

digest algorithm 5),一种被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值,用来确保信息传输完整一致性。
[0044]步骤S401中,对S301中有变化的页面内容进行内容质检,具体质检范围如下:
...

【技术保护点】

【技术特征摘要】
1.一种网站自动化巡检方法,其特征在于,所述巡检方法包括:步骤S1:采用爬虫技术实现页面分析;步骤S2:基于步骤S1解析正常网页内容以及对页面截图,并对生成页面进行hash计算,获得计算结果;步骤S3:根据所述计算结果和历史页面对比分析,监测页面内容是否发生变化;步骤S4:对变化的页面进行内容质检,获得质检结果;步骤S5:根据所述质检结果,对有问题的页面进行片段标注;步骤S6:将所有问题结果进行生成巡检报告。2.根据权利要求1所述的一种网站自动化巡检方法,其特征在于,所述步骤S1:采用爬虫技术实现页面分析具体包括:根据网页url,分析所述页面的状态,并进行记录。3.根据权利要求1所述的一种网站自动化巡检方法,其特征在于,所述步骤S2:基于步骤S1解析正常网页内容以及对页面截图,并对生成页面进行hash计算,获得计算结果具体包括:基于爬虫技术实现对页面内容分析,获取页面内内容;并对页面进行HASH编码,用于历史内容的对比。4.根据权利要求...

【专利技术属性】
技术研发人员:张宪录贾凯鹏
申请(专利权)人:北银金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1