网页编码的分析方法及装置制造方法及图纸

技术编号:14853077 阅读:54 留言:0更新日期:2017-03-18 20:10
本申请公开了网页编码的分析方法及装置,其中,所述方法包括:读取待检测的目标网页,确定所述目标网页中待检测的目标元素对象;在所述目标网页中,获取与所述目标元素对象存在特定结构关系的相关元素对象;将所述相关元素对象与预置的期望元素进行对比;根据对比的结果,确定所述目标网页在所述目标元素对象或所述相关元素对象处是否存在编码错误。通过该方法,可以提高网页编码中识别错误编码的效率,帮助网页设计人员降低网页编码错误的出现概率。

【技术实现步骤摘要】

本申请涉及网页分析
,特别是涉及网页编码的分析方法及装置
技术介绍
随着计算机技术的高速发展以及互联网的广泛普及,越来越多的用户通过互联网获取各种信息,使用各种互联网服务。在互联网信息的载体中,网页是不可或缺的一种,通过网页,服务商可以向用户提供各式各样的数据服务。从新闻浏览,生活信息获取,广告发布,到数据下载,收发邮件,游戏娱乐等等,都可以通过网页来实现。在用户的网络生活中,网页具有不可取代的地位。网页通常由页面设计人员完成设计编码,在进行网页设计编码的工作中,HTML(HyperTextMarkupLanguage,超文本标记语言)语言是使用最广泛的语言之一。HTML语言是一种标记语言,这种语言通过特定符号或符号对来标记要显示在网页中的各个部分内容,规定所要显示的内容的显示样式,以及各部分内容在网页中的显示位置。例如“<p>内容</p>”表示一个段落,“<imgsrc=”…”/>表示一张图片等。浏览器在解析和显示网页时,按HTML文件从上到下的顺序依次读取和解析文件中的标记符号及其标记的内容,并根据标记符号来确定各种网页内容的显示样式和显示位置。同其它计算机编码工作一样,网页编码也应本着正确和规范的原则进行,但也难免会出现错误,例如,一些电子商务平台为店主提供了“店铺装修”功能,店主可以藉由这类功能进行自主的店铺页面的设计,由于店主通常并非专业的设计人员,因而页面出现编码错误的情况时有发生。对于存在编码错误的网页,浏览器在解析网页文件时通常并不会指出其中的错误,而是继续解释执行过程。这样浏览器会将错误的内容显示出来,设计人员通常也只能通过网页的最终显示效果来分析出错原因和出错位置。造成的现状是,对网页错误编码进行检查需要耗费很多时间,检查效率非常低。综上,需要本领域技术人员解决的问题就在于,提供一种网页编码的分析方法,能够更加高效的识别网页编码中的错误,帮助网页设计人员降低网页编码错误的出现概率。
技术实现思路
本申请提供了网页编码的分析方法及装置,可以提高网页编码中识别错误编码的效率,帮助网页设计人员降低网页编码错误的出现概率。本申请提供了如下方案:一种网页编码的分析方法,包括:读取待检测的目标网页,确定所述目标网页中待检测的目标元素对象;在所述目标网页中,获取与所述目标元素对象存在特定结构关系的相关元素对象;将所述相关元素对象与预置的期望元素进行对比;根据对比的结果,确定所述目标网页在所述目标元素对象或所述相关元素对象处是否存在编码错误。一种网页编码的分析装置,包括:目标元素确定单元,用于读取待检测的目标网页,确定所述目标网页中待检测的目标元素对象;相关元素获取单元,用于在所述目标网页中,获取与所述目标元素对象存在特定结构关系的相关元素对象;元素对比单元,用于将所述相关元素对象与预置的期望元素进行对比;错误确定单元,用于根据对比的结果,确定所述目标网页在所述目标元素对象或所述相关元素对象处是否存在编码错误。根据本申请提供的具体实施例,本申请公开了以下技术效果:通过本申请,可以目标网页中确定目标网页中待检测的目标元素对象,获取与目标元素对象存在特定结构关系的相关元素对象,进而将相关元素对象与预置的期望元素进行对比,根据对比的结果,确定目标网页在所述目标元素对象或相关元素对象处是否存在编码错误。本方法从与网页中元素对象的结构关系角度,对网页中的目标元素进行分析,根据发生编码错误的元素对象和与其它元素对象之间的这种结构关系会发生改变,来判断目标元素对象或相关元素对象处是否发生了编码错误,提高了网页编码中识别错误编码的效率,可以帮助网页设计人员降低网页编码错误的出现概率。当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的方法的流程图;图2是本申请实施例提供的装置的示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。请参看图1,为本申请实施例提供的网页编码的分析方法的流程图,如图1所示,该方法可以包括以下步骤:S101:读取待检测的目标网页,确定所述目标网页中待检测的目标元素对象;在进行网页编码的过程中,往往会由于各种原因导致编码错误,对于编码错误的网页,一般的浏览器在解析的过程中并不会指出其中的错误,因而一旦网页出现编码错误,则会造成一些页面元素显示不正确,如某些元素显示在了不正确的位置。另外,由于页面元素嵌套等原因,如果一个元素出现了编码错误,常常导致与其有嵌套关系的其他元素也无法正常显示,从而严重影响页面的显示效果以及美观。同一个网页中的元素对象,通常会与其它一个或多个元素对象存在特定的结构关系,而对于出现编码错误的网页,发生编码错误的元素对象和与其它元素对象之间的这种结构关系会发生改变。本申请实施例旨在提供一种网页编码的分析方法,从网页HTML编码中元素对象的结构关系角度出发,对网页中存在错误编码的元素对象进行检测,从而识别网页编码中的错误,帮助网页设计人员降低网页编码错误的出现概率。首先,可以读取待检测的目标网页,确定目标网页中待检测的目标元素。具体实现该步骤时,可以根据实际应用环境的不同采取不同的方式。例如,当以测试工具对网页编码进行分析时,可以使用测试工具加载目标网页,并确定目标网页中待测的目标元素。也可以调用浏览器加载目标网页,通过向目标网页中注入脚本,并通过所注入的脚本来对目标网页的编码进行分析。具体在确定待检测的目标元素时,也可以有不同的实现方式,例如,可以将目标页面中所有的可分析元素对象中,随机或按预置方式选取的元素列为目标元素对象,并逐一进行分析。当需要进行严格的分析测试时,可以将目标页面中所有的可分析元素对象都列为目标元素对象,并逐一进行分析等。具体在确定目标网页中待检测的目标元素对象时,可以在目标网页中,本文档来自技高网
...

【技术保护点】
一种网页编码的分析方法,其特征在于,包括:读取待检测的目标网页,确定所述目标网页中待检测的目标元素对象;在所述目标网页中,获取与所述目标元素对象存在特定结构关系的相关元素对象;将所述相关元素对象与预置的期望元素进行对比;根据对比的结果,确定所述目标网页在所述目标元素对象或所述相关元素对象处是否存在编码错误。

【技术特征摘要】
1.一种网页编码的分析方法,其特征在于,包括:
读取待检测的目标网页,确定所述目标网页中待检测的目标元素对象;
在所述目标网页中,获取与所述目标元素对象存在特定结构关系的相关元
素对象;
将所述相关元素对象与预置的期望元素进行对比;
根据对比的结果,确定所述目标网页在所述目标元素对象或所述相关元素
对象处是否存在编码错误。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标网页中
待检测的目标元素对象,包括:
在所述目标网页中,根据预置字符串查询各元素对象对应的唯一标识信息,
根据查询到的相匹配的元素对象,确定所述目标网页中待检测的目标元素对象。
3.根据权利要求1所述的方法,其特征在于,所述获取与所述目标元素
对象存在特定结构关系的相关元素对象,包括:
获取与所述目标元素对象存在特定结构关系的以下相关元素对象:
目标元素对象的父元素;
目标元素对象的下一个兄弟元素;
目标元素对象的上一个兄弟元素;
目标元素对象的子元素。
4.根据权利要求1所述的方法,其特征在于,所述获取与所述目标元素
对象存在特定结构关系的相关元素对象,包括:
获取与所述目标元素对象存在特定结构关系的两个或两个以上的相关元
素对象,并将所述两个或两个以上的相关元素对象的信息表示为第一数组;
所述将所述相关元素对象与预置的期望元素进行对比,包括:
将所述第一数组与预置的第二数组进行对比;所述第二数组包括所述预置
的期望元素的信息,并与所述第一数组具有相同的数据结构。
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:
在确定所述目标网页在所述目标元素对象或所述相关元素对象处存在编
码错误后,返回编码错误的元素对象的信息。
6.一种网页编码的分析装置,其特征在于,包括:
目标元...

【专利技术属性】
技术研发人员:王兆平
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1