转码后线上线下环境页面对比的分析方法和设备技术

技术编号:15399244 阅读:52 留言:0更新日期:2017-05-23 11:07
提供了一种转码后线上线下环境页面对比的分析方法和设备。所述方法包括:获取并存储配置文件;根据存储的配置文件获取线上和线下访问的html页面;通过对比线上和线下访问的html页面的Dom树来获取线上和线下访问的html页面之间的差别;根据获取的线上和线下访问的html页面之间的差别来对线上和线下访问的html页面之间的相似性进行打分;根据获取的线上和线下访问的html页面之间的差别来将线上和线下访问的html页面之间的变化进行漂染;展现漂染后的线上和线下访问的html页面以及打分结果。

Method and apparatus for comparing post and post online environment pages after transcoding

The invention provides an analysis method and a device for comparing the online and offline environment pages after transcoding. The method comprises: acquiring and storing files; according to the stored configuration file to get online and offline access to HTML pages; through the comparison between online and offline access to the HTML page of the Dom tree to get online and offline access to HTML pages according to the difference; between access line and offline access the difference between the HTML page similarity between online and offline access to HTML page scoring; according to the access between online and offline access to HTML pages the difference will vary between online and offline access to HTML pages for dyeing; dyeing after the show online and offline access to HTML pages and the scoring results.

【技术实现步骤摘要】
转码后线上线下环境页面对比的分析方法和设备
本专利技术涉及转码后页面效果的比较,更具体地讲,涉及一种转码后线上线下环境页面对比的分析方法和设备。
技术介绍
以前的网页主要针对计算机等固定终端,随着智能终端(例如智能手机)等也可以浏览各种网页的移动终端的出现,由于这些移动终端的显示屏幕的大小或者移动终端中系统的限制,并不是所有的移动终端都能够很好地显示出各种网页的网页效果,因此需要使用转码器对原本针对计算机设计的原网页进行转码,使其适应各种移动终端的显示屏幕。由于互联网的网页千姿百态、页面类型和形态不胜枚举,现有技术中对转码页面的质量测试是用人工用肉眼进行测试,即人工对两个网页进行一一比对以找到差异。由于人为主观因素,还容易导致测试的页面种类不全,使测试结果参考性大打折扣。
技术实现思路
因此,本专利技术提供了一种用于转码后线上线下环境页面对比的分析方法,所述方法包括:获取并存储配置文件;根据存储的配置文件获取线上和线下访问的html页面;通过对比线上和线下访问的html页面的Dom树来获取线上和线下访问的html页面之间的差别;根据获取的线上和线下访问的html页面之间的差别来对线上和线下访问的html页面之间的相似性进行打分;根据获取的线上和线下访问的html页面之间的差别来将线上和线下访问的html页面之间的变化进行漂染;展现漂染后的线上和线下访问的html页面以及打分结果。优选地,获取线上和线下访问的html页面可包括:根据存储的配置文件拼接线上和线下访问的URL;根据拼接的线上和线下访问的URL获取执行javascript后的线上和线下访问的html页面。优选地,可通过使用模拟浏览内核程序来执行URL,从而生成执行javascript后的html页面。优选地,获取线上和线下访问的html页面之间的差别可包括:预处理线上和线下访问的html页面;对比预处理后的线上和线下访问的html页面的Dom树。优选地,对比预处理后的线上和线下访问的html页面的Dom树可包括:获取线上和线下访问的html页面的Dom树;遍历Dom树获取各个标签的内容;分别针对线上和线下访问的html页面的Dom树中获取的各个标签内容进行比较;以Hash数组形式展示比较结果。本专利技术提供了一种用于转码后线上线下环境页面对比的分析设备,所述分析设备可包括:配置文件获取单元,获取并存储配置文件;HTML页面获取单元,根据存储的配置文件获取线上和线下访问的html页面;HTML页面差别计算单元,通过对比线上和线下访问的html页面的Dom树来获取线上和线下访问的html页面之间的差别;打分单元,根据获取的线上和线下访问的html页面之间的差别来对线上和线下访问的html页面之间的相似性进行打分;漂染单元,根据获取的线上和线下访问的html页面之间的差别来将线上和线下访问的html页面之间的变化进行漂染;展现单元,展现漂染后的线上和线下访问的html页面以及打分结果。优选地,HTML页面获取单元可包括:URL拼接子单元,根据存储的配置文件拼接线上和线下访问的URL;HTML页面获取子单元,根据拼接的线上和线下访问的URL获取执行javascript后的线上和线下访问的html页面。优选地,HTML页面获取子单元可通过使用模拟浏览内核程序来执行URL,从而生成执行javascript后的html页面。优选地,HTML页面差别计算单元可包括:HTML页面预处理单元,预处理线上和线下访问的html页面;Dom树对比单元,对比预处理后的线上和线下访问的html页面的Dom树。优选地,Dom树对比单元可通过获取线上和线下访问的html页面的Dom树,遍历Dom树获取各个标签的内容,分别针对线上和线下访问的html页面的Dom树中获取的各个标签内容进行比较,并以Hash数组形式展示比较结果,来对比预处理后的线上和线下访问的html页面的Dom树。将在接下来的描述中部分阐述本专利技术另外的方面和/或优点,还有一部分通过描述将是清楚的,或者可以经过本专利技术的实施而得知。附图说明通过下面结合附图对本专利技术的实施例进行描述,本专利技术的上述和其他目的将会变得更加清楚,其中:图1是示出根据本专利技术实施例的用于转码后线上线下环境页面对比的分析方法的流程图;图2是示出根据本专利技术实施例的根据存储的配置文件获取线上和线下访问的html页面的详细过程;图3是示出根据本专利技术实施例的获取线上和线下访问的html页面之间的差别的详细过程;图4是示出Dom树的示意图;图5是示出遍历Dom树后得到的text、branch、img、link数组的示意图;图6是示出对比线上Dom树和线下Dom树的示意图;图7是示出对比后得到的data数组(Branch、Image、Link)的示意图;图8是示出对比后得到的data数组(Text)的示意图;图9是示出Branch、Text、Image、Link数组对比后的hash数组;图10是示出针对每个结点打分的示意图;图11是示出将不同内容漂染后的html页面的示意图;图12是示出将所有结果进行展现的示意图;图13是示出本专利技术实施例的用于转码后线上线下环境页面对比的分析设备的结构的框图。具体实施方式图1是示出根据本专利技术实施例的用于转码后线上线下环境页面对比的分析方法的流程图。如图1所示,在S101,获取并存储配置文件。具体的讲,配置文件可包括为页面打分的权值配置文件、页面类型配置文件、运行所需的其他配置文件(如线上线下机器名字、选择架构体系建站架构或云阅读架构或简略转码架构)、发送邮件地址等相关配置文件。这些配置文件可被存储(例如,放置)在目录(例如,一个conf目录)中,因此在需要时可通过读取该目录来得到配置文件。例如,由于线下的测试机器不固定、转码服务的统一资源定位器(URL)中各种参数在测试中不固定,因此将线上线下机器配置文件抽取出来并放置在预定目录中。在需要时,可以在该预定目录中添加需要的参数,如不中缓存的nocache,查看页面模块wdebug参数等等。随后,在S102,根据存储的配置文件获取线上和线下访问的html页面。如图2所示,S102可包括子S1021和S1022。在S1021,根据存储的配置文件拼接线上和线下访问的URL。例如,可通过从存储的配置文件中读取线上线下机器URL相关配置文件,来拼接线上和线下访问的URL。拼接就是将两个字符串连接到一起构成一个新的字符串。例如,URL="测试环境IP"+"/"+"参数1"+"&"+"参数2"+"&"+"......"+"&src="+"PCURL"就是拼接后的URL。在S1022,根据拼接的线上和线下访问的URL获取执行javascript后的线上和线下访问的html页面。具体的讲,在本专利技术的实施例中通过使用模拟浏览内核程序来执行URL,从而生成执行javascript后的html页面。现在返回图1,在S103,通过对比线上和线下访问的html页面的Dom树来获取线上和线下访问的html页面之间的差别。如图3所示,S103可包括子S1031和S1032。在S1031,预处理线上和线下访问的html页面。可通过去除html页面中的无用字符来执行所述预处理,例如,去掉文本本文档来自技高网...
转码后线上线下环境页面对比的分析方法和设备

【技术保护点】
一种用于转码后线上线下环境页面对比的分析方法,所述方法包括:获取并存储配置文件;根据存储的配置文件获取线上和线下访问的html页面;通过对比线上和线下访问的html页面的Dom树的各个标签的内容来获取线上和线下访问的html页面之间的差别,其中,以Hash数组形式展示比较线上和线下访问的html页面的Dom树中的各个标签的结果;根据获取的线上和线下访问的html页面之间的差别来对线上和线下访问的html页面之间的相似性进行打分;根据获取的线上和线下访问的html页面之间的差别来将线上和线下访问的html页面之间的变化进行漂染;展现漂染后的线上和线下访问的html页面以及打分结果,其中,根据获取的线上和线下访问的html页面之间的差别来对线上和线下访问的html页面之间的相似性进行打分包括:通过遍历Dom树的每个结点,根据Hash结果、优先级、层级数对各结点进行打分,并对各结点的分数进行汇总以计算出总分数。

【技术特征摘要】
1.一种用于转码后线上线下环境页面对比的分析方法,所述方法包括:获取并存储配置文件;根据存储的配置文件获取线上和线下访问的html页面;通过对比线上和线下访问的html页面的Dom树的各个标签的内容来获取线上和线下访问的html页面之间的差别,其中,以Hash数组形式展示比较线上和线下访问的html页面的Dom树中的各个标签的结果;根据获取的线上和线下访问的html页面之间的差别来对线上和线下访问的html页面之间的相似性进行打分;根据获取的线上和线下访问的html页面之间的差别来将线上和线下访问的html页面之间的变化进行漂染;展现漂染后的线上和线下访问的html页面以及打分结果,其中,根据获取的线上和线下访问的html页面之间的差别来对线上和线下访问的html页面之间的相似性进行打分包括:通过遍历Dom树的每个结点,根据Hash结果、优先级、层级数对各结点进行打分,并对各结点的分数进行汇总以计算出总分数。2.如权利要求1所述的分析方法,其中,获取线上和线下访问的html页面包括:根据存储的配置文件拼接线上和线下访问的URL;根据拼接的线上和线下访问的URL获取执行javascript后的线上和线下访问的html页面。3.如权利要求2所述的分析方法,其中,通过使用模拟浏览内核程序来执行URL,从而生成执行javascript后的html页面。4.如权利要求1所述的分析方法,其中,获取线上和线下访问的html页面之间的差别包括:预处理线上和线下访问的html页面;对比预处理后的线上和线下访问的html页面的Dom树。5.如权利要求4所述的分析方法,其中,对比预处理后的线上和线下访问的html页面的Dom树包括:获取线上和线下访问的html页面的Dom树;遍历Dom树获取各个标签的内容;分别针对线上和线下访问的html页面的Dom树中获取的各个标签内容进行比较;以Hash数组形式展示比较结果。6.一种用于转码后线上线下环境页面对比的分析设备,所...

【专利技术属性】
技术研发人员:王峰邹静
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1