【技术实现步骤摘要】
页面改版的监控方法及相关系统
本专利技术涉及计算机软件
,尤其涉及一种页面改版的监控方法及相关系统。
技术介绍
目前,各个网站根据栏目的不同,会设置有多种不同的页面。因此,针对每一种页面,需要依据页面的特点配置对应的解析模板,用以对页面进行解析。在利用解析模板解析页面的实际应用过程中,若页面改版,采用原有的解析模板进行解析会出现解析失败的问题。因此,在页面的解析过程中还需要识别每一个页面是否进行了改版。目前页面的改版的识别主要是通过人工统计数据的方式。由人工统计页面解析后的数据,判断数据是否有缺失,处理效率低且准确性差。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的页面改版的监控方法及相关系统。一种页面改版的监控方法,包括:获取至少一个页面对应的页面解析结果,所述页面解析结果通过解析模板对所述页面解析后得到;其中,所述页面解析结果包括未解析出的异常字段信息以及所述异常字段信息对应的解析模板标识;根据所述解析模 ...
【技术保护点】
1.一种页面改版的监控方法,其特征在于,包括:/n获取至少一个页面对应的页面解析结果,所述页面解析结果通过解析模板对所述页面解析后得到;其中,所述页面解析结果包括未解析出的异常字段信息以及所述异常字段信息对应的解析模板标识;/n根据所述解析模板标识对所述异常字段信息进行聚类统计,得到每个解析模板对应的异常解析数;/n判断每个解析模板对应的异常解析数是否超过对应的预设异常阈值;/n如果是,则判断所述解析模板对应的页面发生改版。/n
【技术特征摘要】
1.一种页面改版的监控方法,其特征在于,包括:
获取至少一个页面对应的页面解析结果,所述页面解析结果通过解析模板对所述页面解析后得到;其中,所述页面解析结果包括未解析出的异常字段信息以及所述异常字段信息对应的解析模板标识;
根据所述解析模板标识对所述异常字段信息进行聚类统计,得到每个解析模板对应的异常解析数;
判断每个解析模板对应的异常解析数是否超过对应的预设异常阈值;
如果是,则判断所述解析模板对应的页面发生改版。
2.根据权利要求1所述的方法,其特征在于,在判断所述解析模板对应的页面发生改版后,所述方法还包括以下至少一项:
停止采用发生改版的页面对应的解析模板进行页面解析;
将发生改版的页面对应的解析模板的状态设置为不可用状态;
在检测到发生改版的页面对应的解析模板发生更新后,将更新后的解析模板的状态设置为可用状态。
3.根据权利要求1所述的方法,其特征在于,所述判断每个解析模板对应的异常解析数是否超过对应的预设异常阈值之后,所述方法还包括:
根据每个解析模板对应的异常解析数的判断结果,生成异常解析日志,其中,所述异常解析日志中包括以下信息中的至少一项:超过对应的预设异常阈值的解析模板的解析模板标识、页面URL和解析模板创建者信息,所述信息以列表的形式记录在所述异常解析日志中;
将所述异常解析日志保存至数据库;和/或
向预设地址发送所述异常解析日志。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括以下至少一项:
所述页面解析结果的存储形式为日志;
所述异常字段信息包括空值或预设错误标识;
当所述解析模板为多个时,每个所述解析模板对应的预设异常阈值相同,或者,多个所述解析模板对应的预设异常阈值中至少存在两个以上不同。
5.根据权利要求1所述的方法,其特征在于,在获取至少一个页面对应的页面解析结果之前,所述方法还包括:
获取每个待解析页面对应的解析模板;
采用所述解析模...
【专利技术属性】
技术研发人员:袁园,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。