一种基于图像的端上智能化页面质量巡检方法技术

技术编号：26790653 阅读：41 留言：0更新日期：2020-12-22 17:05

本发明专利技术公开了一种基于图像的端上智能化页面质量巡检方法，该方法首先获得正常态和异常态页面的DOM元素矩形框坐标、截图、异常区域位置的矩形框坐标，训练页面异常问题分类和检测模型以及元素语义识别模型，然后获得待检查页面所有DOM元素位置信息和截图，按DOM元素分布特点对各类别模块预分类，采用元素语义识别模型对通用性模块进行识别，采用训练好的检测模型直接检测空坑类和文案重叠类问题，根据有效SURF特征识别空屏类问题，通过相邻楼层标题的距离鉴别空楼层问题，计算商品资源位的相似度来判断相同元素问题。本发明专利技术可解放测试人员进行重复的手工测试工作，会对测试工作和线上监控巡检工作有着显著的降本提效的作用。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图像的端上智能化页面质量巡检方法
本专利技术属于测试技术、计算机视觉
，尤其涉及一种基于图像的端上智能化页面质量巡检方法。
技术介绍
随着移动互联网的蓬勃发展，商品对象信息服务系统已然由PC时代转到无线时代。在数字电商行业，由于营销促销活动种类繁多，变动灵活，营销活动的会场H5页面发布往往支持营销规则制定者(非技术人员)随时根据运营及营销需求灵活新建配置或变更配置。变更的灵活性则可能会带来更大的线上质量风险，而这些页面的线上质量往往直接影响到用户体验、营销活动效果，甚至成交。但页面的强分散性大大提升了质量保障难度，尤其是大促期间数百甚至数千个H5活动/会场页数千次变更发布导致投入人力测试成本极高(多人交互沟通、多平台切换操作、任务零碎且分散)。因此，需要一套通用、低成本方案对页面可能出现的空屏、空窗(某些资源位缺失)“空楼层”(模块内容缺失)等共性严重问题进行有效探测进而高效保障页面线上质量。
技术实现思路
本专利技术的目的在于针对现有技术的不足，提供一种基于图像的端上智能化页面质量巡检方法。本专利技术的目的是通过以下技术方案来实现的：一种基于图像的端上智能化页面质量巡检方法，包括以下步骤：S1：获取页面的DOM元素位置信息和页面截图，所述页面截图包括正常态页面截图和异常态页面截图；所述异常态截图包括含有空坑的页面截图和含有文案重叠覆盖问题的页面截图；并额外获取空坑区域和文案重叠覆盖区域对应的DOM元素位置信息；S2：根据步骤S1获得的DOM元素位置信息和页面...

【技术保护点】
1.一种基于图像的端上智能化页面质量巡检方法，其特征在于，包括以下步骤：/nS1：获取页面的DOM元素位置信息和页面截图，所述页面截图包括正常态页面截图和异常态页面截图等。所述异常态截图包括含有空坑的页面截图和含有文案重叠覆盖问题的页面截图；并额外获取空坑区域和文案重叠覆盖区域对应的DOM元素位置信息。/nS2：根据步骤S1获得的DOM元素位置信息和页面截图，分别训练条状模块分类模型、资源位模块分类模型、空坑类异常检测模型和文案重叠覆盖识别模型。/nS3：获取待检查页面的DOM元素位置信息和待检查页面截图，筛选并截取待检查条状元素和待检查资源位元素等。/nS4：利用步骤S2得到的条状模块分类模型和资源位模块分类模型，分别对步骤S3得到的待检查条状元素和待检查资源位元素进行分类。/nS5：针对不同页面问题进行识别，包括空坑类、空楼层类、空屏类、重复素材和文案重叠覆盖类。/n

【技术特征摘要】
1.一种基于图像的端上智能化页面质量巡检方法，其特征在于，包括以下步骤：
S1：获取页面的DOM元素位置信息和页面截图，所述页面截图包括正常态页面截图和异常态页面截图等。所述异常态截图包括含有空坑的页面截图和含有文案重叠覆盖问题的页面截图；并额外获取空坑区域和文案重叠覆盖区域对应的DOM元素位置信息。
S2：根据步骤S1获得的DOM元素位置信息和页面截图，分别训练条状模块分类模型、资源位模块分类模型、空坑类异常检测模型和文案重叠覆盖识别模型。
S3：获取待检查页面的DOM元素位置信息和待检查页面截图，筛选并截取待检查条状元素和待检查资源位元素等。
S4：利用步骤S2得到的条状模块分类模型和资源位模块分类模型，分别对步骤S3得到的待检查条状元素和待检查资源位元素进行分类。
S5：针对不同页面问题进行识别，包括空坑类、空楼层类、空屏类、重复素材和文案重叠覆盖类。

2.如权利要求1所述基于图像的端上智能化页面质量巡检方法，其特征在于，所述DOM元素位置信息包括DOM元素的矩形包围框在页面截图中的相对坐标、矩形包围框的长宽比、矩形包围框与截图对应的各边之比和矩形包围框的面积。

3.如权利要求1所述基于图像的端上智能化页面质量巡检方法，其特征在于，所述步骤S2中，所述条状模块分类模型和资源位模块分类模型的训练过程具体为：根据步骤S1获得的DOM元素位置信息和页面截图，筛选并截取得到条状元素和资源位元素；根据条状元素ROI及其对应的类别采用深度学习残差网络或自动机器学习技术训练得到条状模块分类模型，输入为条状元素，输出为条状元素类别；根据资源位元素及其对应的类别采用深度学习残差网络或自动机器学习技术训练得到资源位模块分类模型，输入为资源位元素，输出为资源位元素类别；
所述空坑类异常检测模型的训练过程具体为：批量执行S1后，首先对于S1中获得的含有空坑的页面截图及空坑元素对应的DOM的包围框坐标的标签进行一轮人工复核打标，即删除实际为非空坑标签的样本和增加标注未标注的空坑区域，得到复核后的含有空坑的页面截图和其标记包围框样本数据后，采用R-FCN目标检测框架训练得到空坑类检测模型，模型的输入为图像，输出为是否含有空坑；
所述文案重叠覆盖识别模型的训练过程具体为：根据步骤S1获得的含有文案重叠覆盖问题的页面截图和问题区域的DOM元素位置信息后，采用R-FCN目标检测框架训练得到文案重叠覆盖类检测模型，输入为页面截图，输出为是否存在文案重叠覆盖。

4.如权利要求3所述基于图像的端上智能化页面质量巡检方法，其特征在于，所述条状元素的筛选条件为w/h∈(5,6)，w/W∈[1,3)；所述资源位元素的筛选条件为h/w<3且w/h<3.5且15W<h*w<150W；w为元素的宽度，h为元素的高度，W为元素所在图像的宽度。

5.如权利要求3所述基于图像的端上智能化页面质量巡检方法，其特征在于，所述条状元素的类别包括电梯导航模块、楼层标题、底部Tab导...

【专利技术属性】
技术研发人员：陈琴，周小群，邓水光，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人