浏览质量的评估方法及装置制造方法及图纸

技术编号:9618304 阅读:81 留言:0更新日期:2014-01-30 06:07
本发明专利技术公开了一种浏览质量的评估方法,包括:获取第三方站点的待测页面,并分析所述待测页面以获得第一原始特征集;对所述待测页面进行转码以生成转码后的待测页面,并获得所述待测页面的结构化特征集;对所述转码后的待测页面进行分析以获得第二原始特征集;按照预设的组合规则将所述第一原始特征集、第二原始特征集和所述结构化特征集进行组合以生成组合特征集;根据预设的评估模型和所述组合特征集对所述待测页面进行质量评估。本发明专利技术可以实现对页面的排版质量、内容完整性、展现速度等进行评估,从而为用户访问该页面提供指导,有利于提高用户访问的体验度。本发明专利技术还公开了一种浏览质量的评估系统。

Method and device for evaluating browsing quality

The invention discloses a browsing quality assessment method, including: the test page for the site of the third party, and the analysis of the test page to obtain the original feature set; on the test page for transcoding to generate test page after transcoding, and get the test page structured feature on the set; after transcoding to obtain second original feature set analysisshowed page; according to the combination rule preset the first original feature set, second original feature set and the structured feature set are combined to generate a combined feature set; according to the model and the combination of the feature set the page test assesses the quality of presupposition. The invention can evaluate the typesetting quality, the content integrity and the display speed of the page, thereby providing guidance for the user to access the page, and improving the experience of the user access. The invention also discloses an evaluation system for browsing quality.

【技术实现步骤摘要】
浏览质量的评估方法及装置
本专利技术涉及互联网
,特别涉及一种浏览质量的评估方法及装置。
技术介绍
随着互联网深入到人们的日常生活,页面的浏览质量也越来越受到开发人员及用户的关注。为了提高页面的浏览质量,需要对页面质量进行评估。特别是在搜索引擎系统中,页面质量评估具有关键作用。因为,页面的浏览质量会直接影响到用户选择的搜索结果。例如,页面中的文字、图片的排版或质量有问题,则可能导致用户选择的搜索结果的改变。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术问题之一或至少提供一种有用的商业选择。为此,本专利技术的第一个目的在于提出一种准确度高、评估内容全面的浏览质量的评估方法。本专利技术的第二个目的在于提出一种浏览质量的评估装置。为实现上述目的,本专利技术的第一个目的在于提出一种浏览质量的评估方法,包括如下步骤:获取第三方站点的待测页面,并分析所述待测页面以获得第一原始特征集;对所述待测页面进行转码以生成转码后的待测页面,并获得所述待测页面的结构化特征集;对所述转码后的待测页面进行分析以获得第二原始特征集;按照预设的组合规则将所述第一原始特征集、第二原始特征集和所述结构化特征集进行组合以生成组合特征集;以及根据预设的评估模型和所述组合特征集对所述待测页面进行质量评估。根据本专利技术实施例的浏览质量的评估方法,利用提取得到的待测页面的转码前和转码后的特征,以及转码后得到的结构化特征集生成组合特征集,从而表征转码后的页面中各种原始特征的分析结果,利用上述组合特征集和预设的评估模型对页面的质量进行评估,可以实现对页面的排版质量、内容完整性、展现速度等进行评估,从而为用户访问该页面提供指导,有利于提高用户访问的体验度。本专利技术第二方面的实施例提供了一种浏览质量的评估装置,包括:页面获取模块,用于获取第三方站点的待测页面;转码模块,用于对所述待测页面进行转码以生成转码后的待测页面,并获得所述待测页面的结构化特征集;分析模块,用于对所述待测页面进行分析以获得第一原始特征集,以及对所述转码后的待测页面进行分析以获得第二原始特征集;组合模块,用于按照预设的组合规则将所述第一原始特征集、第二原始特征集和所述结构化特征集进行组合以生成组合特征集;质量评估模块,用于建立评估模型,并根据所述评估模型和所述组合特征集对所述待测页面进行质量评估。根据本专利技术实施例的浏览质量的评估装置,利用提取得到的待测页面的转码前和转码后的特征,以及转码后得到的结构化特征集生成组合特征集,从而表征转码后的页面中各种原始特征的分析结果,利用上述组合特征集和预设的评估模型对页面的质量进行评估,可以实现对页面的排版质量、内容完整性、展现速度等进行评估,从而为用户访问该页面提供指导,有利于提高用户访问的体验度。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术实施例的浏览质量的评估方法的流程图;图2为根据本专利技术实施例的评估模型的建立流程图;图3为根据本专利技术实施例的特征提取的流程图;图4为根据本专利技术实施例的对页面进行质量评估的流程图;图5为根据本专利技术实施例的浏览质量的评估装置的示意图;图6为根据本专利技术实施例的转码模块的示意图;以及图7为根据本专利技术实施例的质量评估模块的示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。在本专利技术中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利技术中的具体含义。在本专利技术中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度小于第二特征。下面参考图1至图4描述根据本专利技术实施例的浏览质量的评估方法。如图1所示,本专利技术实施例提供的浏览质量的评估方法,包括如下步骤:步骤S101,获取第三方站点的待测页面,并对该待测页面进行分析,获得第一原始特征集。在本专利技术的示例中,第一原始特征集包括转码前的待测页面中的文字、图片、动画的数量和面积信息。步骤S102,对待测页面进行转码以生成转码后的待测页面,并获得待测页面的结构化特征集。通过以下步骤获得待测页面的结构化特征集:首先,对待测页面进行结构化分析,获得待测页面的页面类型和内容块。其中,页面类型包括但不限于新闻页面、购物页面、论坛页面等。然后,对待测页面的内容块进行分析,获得待测页面的结构化特征。在本专利技术的一个实施例中,结构化特征包括但不限于待测页面中的标题、图标(Logo)和联系方式中的一种或多种。步骤S103,对转码后的待测页面进行分析以获得第二原始特征集。在本专利技术的示例中,第二原始特征集包括转码后的待测页面中的文字、图片、动画的数量和面积信息。步骤S104,按照预设的组合规则将第一原始特征集、第二原始特征集和结构化特征集进行组合以生成组合特征集。根据待测页面的页面类型选择对应的组合规则。具体地,不同的页面类型具有不同的质量关键点,待测页面为不同的页面类型时,其选择的组合规则也是不同的。例如,待测页面为新闻页面、论坛页面或购物页面时,其选择的组合规则是不同的。步骤S105,根据预设的评估模型和组合特征集对待测页面进行质量评估。在本专利技术的实施例中,对待测页面质量的评估包括对以下内容进行评估:(1)页面能否正常访问。(2)页面排版是否合理。例如,转码后的待测页面中的图片是否可以完整显示,并且图文混排时是否会导致页面杂乱。(3)页面内容是否完整。例如,文字内容是本文档来自技高网...
浏览质量的评估方法及装置

【技术保护点】
一种浏览质量的评估方法,其特征在于,包括:获取第三方站点的待测页面,并分析所述待测页面以获得第一原始特征集;对所述待测页面进行转码以生成转码后的待测页面,并获得所述待测页面的结构化特征集;对所述转码后的待测页面进行分析以获得第二原始特征集;按照预设的组合规则将所述第一原始特征集、第二原始特征集和所述结构化特征集进行组合以生成组合特征集;以及根据预设的评估模型和所述组合特征集对所述待测页面进行质量评估。

【技术特征摘要】
1.一种浏览质量的评估方法,其特征在于,包括:获取第三方站点的待测页面,并分析所述待测页面以获得第一原始特征集,其中,所述第一原始特征集包括转码前的待测页面中的文字、图片、动画的数量和面积信息;对所述待测页面进行转码以生成转码后的待测页面,并获得所述待测页面的结构化特征集,其中,所述结构化特征包括所述待测页面中的标题、图标和联系方式中的一种或多种;对所述转码后的待测页面进行分析以获得第二原始特征集,其中,第二原始特征集包括转码后的待测页面中的文字、图片、动画的数量和面积信息;按照预设的组合规则将所述第一原始特征集、第二原始特征集和所述结构化特征集进行组合以生成组合特征集;以及根据预设的评估模型和所述组合特征集对所述待测页面进行质量评估。2.如权利要求1所述的浏览质量的评估方法,其特征在于,所述评估模型通过以下步骤得到:建立训练样本库,所述训练样本库中包括多个训练样本;对所述训练样本库中的每个训练样本进行特征提取,并生成每个训练样本对应的训练特征集;根据机器学习算法对所述训练特征集进行处理以生成所述评估模型。3.如权利要求2所述的浏览质量的评估方法,其特征在于,所述训练样本包括URL列表和URL列表中每个URL对应的人工评估结果。4.如权利要求1所述的浏览质量的评估方法,其特征在于,还包括:根据所述待测页面的页面类型选择对应的组合规则。5.如权利要求1所述的浏览质量的评估方法,其特征在于,所述获得所述待测页面的结构化特征集进一步包括:对所述待测页面进行结构化分析,以获得所述待测页面的页面类型和内容块;对所述待测页面的内容进行分析以获得所述待测页面的结构化特征。6.一种浏览质量的评估装置,其特征在于,包括:页面获取模块,用于获取第三方站点的待测页面;转码模块,用于对所述待...

【专利技术属性】
技术研发人员:于高薛林波
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1