当前位置: 首页 > 专利查询>北京大学专利>正文

一种web应用动态演化监测方法技术

技术编号:24168213 阅读:57 留言:0更新日期:2020-05-16 02:06
本发明专利技术提供了一种web应用动态演化监测方法,包括:定期获取待监测的Web页面;根据预设的监测配置信息中的关键内容,在所述Web页面的文档对象模型DOM树中定位到相应节点;当无法定位到相应节点时,则确定为所述Web页面变化;当定位到相应节点时,在所述Web页面中获得包含所述关键内容的当前内容块;将所述当前内容块的标题与在初始化监测任务中从所述Web页面获得的初始内容块的标题进行对比,根据对比结果,确定所述Web页面是否发生变化,以此可以辅助开发者及时主动地发现目标Web应用页面结构上的相关变化,以确定已有系统间的对接是否已经失效。

A dynamic evolution monitoring method for web applications

【技术实现步骤摘要】
一种web应用动态演化监测方法
本专利技术涉及页面动态监测
,特别是涉及一种web应用动态演化监测方法。
技术介绍
Web应用常常会由于升级、修补漏洞、用户体验优化等导致页面结构发生动态变化。这种变化会给关联系统之间的对接产生影响。例如,通过嵌入页面而实现的两个系统直接的对接,一个系统变化会导致另一个系统不可用;又例如,通过数据采集而完成的舆情监控,页面结构变化会导致无法继续获取到正确的舆情内容。因此,如何主动地监测到系统页面的变化成为一个重要的研究点。由于Web应用开发团队及所使用技术栈的不同,作为一种低开销、非侵入、低风险的方案,从Web应用的表现层(也称用户界面层)入手实现系统间的整合与对接成为一种较为有效的方案。然而,此种方案与Web页面的布局结构有着较强的关联性,Web页面布局的变化可能使得已有的整合对接方案失效,这也就成为Web应用整合对接中必须考虑的问题。同时,Web应用变化的不可预知性,使得对变化没有有效的预警方式,无法及时地检测到变化。因此,如何及时主动地发现Web应用页面的变化,辅助开发人员进行修复,以本文档来自技高网...

【技术保护点】
1.一种web应用动态演化监测方法,其特征在于,包括:/n定期获取待监测的Web页面;/n根据预设的监测配置信息中的关键内容,在所述Web页面的文档对象模型DOM树中定位到相应节点;/n当无法定位到相应节点时,则确定为所述Web页面变化;/n当定位到相应节点时,所述方法包括:/n在所述Web页面中获得包含所述关键内容的当前内容块;/n将所述当前内容块的标题与在初始化监测任务中从所述Web页面获得的初始内容块的标题进行对比;/n如果标题非空且相等,则确定为所述Web页面没有发生相关变化;/n如果标题非空且不相等,则判断为定位到错误节点,输出检测到相关变化的结果;/n如果标题均为空,则计算所述当前...

【技术特征摘要】
1.一种web应用动态演化监测方法,其特征在于,包括:
定期获取待监测的Web页面;
根据预设的监测配置信息中的关键内容,在所述Web页面的文档对象模型DOM树中定位到相应节点;
当无法定位到相应节点时,则确定为所述Web页面变化;
当定位到相应节点时,所述方法包括:
在所述Web页面中获得包含所述关键内容的当前内容块;
将所述当前内容块的标题与在初始化监测任务中从所述Web页面获得的初始内容块的标题进行对比;
如果标题非空且相等,则确定为所述Web页面没有发生相关变化;
如果标题非空且不相等,则判断为定位到错误节点,输出检测到相关变化的结果;
如果标题均为空,则计算所述当前内容块与所述初始内容块之间的语义相似度以及DOM子树的结构相似度,并将所述语义相似度与预设语义阈值进行比较,以及将所述结构相似度与预设结构阈值进行比较,根据比较结果,确定所述Web页面是否发生变化。


2.根据权利要求1所述的方法,其特征在于,在定期获取待监测的Web页面之前,所述方法包括:
接收用户输入的待监测Web页面的所述监测配置信息;
根据所述监测配置信息,生成用于监测所述待监测Web页面的页面变化的监测任务;
所述初始化监测任务包括:
获取所述Web页面的初始页面信息;
根据所述监测配置信息中的关键内容,在所述初始页面信息中,获得包含所述关键内容的初始内容块。


3.根据权利要求1或2所述的方法,其特征在于,所述监测配置信息包括所述用户的登录信息和用于验证所述登录信息的Cookie信息;
所述接收用户输入的待监测Web页面的所述监测配置信息的步骤包括:
接收用户针对所述Web页面的登录操作,获得该用户的登录信息;
将所述登录信息发送给所述Web页面对应的服务器;
接收所述服务器针对所述登录信息返回的用于验证所述登录信息的Cookie信息;
所述定期获取待监测的Web页面的步骤包括:
定期将所述Cookie信息以HTTP请求头的方式同获取所述Web页面的请求一并发送给所述Web页面对应的服务器;
接收所述服务器针对所述请求返回的所述Web页面。


4.根据权利要求1所述的方法,其特征在于,所述监测配置信息包括所述Web页面的超文本标记语言HTML代码和所述当前内容块对应的XML路径语言XPath;
所述当前内容块的标题的获得方法包括:
将所述HTML代码解析成对应的DOM树;
根据所述当前内容块对应的XPath,从所述DOM树中提取当前内容块CB;
查询与所述CB相似的兄弟节点的列表CBList;
获取所述CB在所述CBList中的下标i;
将当前内容块CB赋值给循环变量curNode,开始循环,直到找到所述当前内容块的标题;其中,所述循环变量的...

【专利技术属性】
技术研发人员:张颖徐经纬黄罡梅宏
申请(专利权)人:北京大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1