The invention discloses a browsing quality assessment method, including: the test page for the site of the third party, and the analysis of the test page to obtain the original feature set; on the test page for transcoding to generate test page after transcoding, and get the test page structured feature on the set; after transcoding to obtain second original feature set analysisshowed page; according to the combination rule preset the first original feature set, second original feature set and the structured feature set are combined to generate a combined feature set; according to the model and the combination of the feature set the page test assesses the quality of presupposition. The invention can evaluate the typesetting quality, the content integrity and the display speed of the page, thereby providing guidance for the user to access the page, and improving the experience of the user access. The invention also discloses an evaluation system for browsing quality.
【技术实现步骤摘要】
浏览质量的评估方法及装置
本专利技术涉及互联网
,特别涉及一种浏览质量的评估方法及装置。
技术介绍
随着互联网深入到人们的日常生活,页面的浏览质量也越来越受到开发人员及用户的关注。为了提高页面的浏览质量,需要对页面质量进行评估。特别是在搜索引擎系统中,页面质量评估具有关键作用。因为,页面的浏览质量会直接影响到用户选择的搜索结果。例如,页面中的文字、图片的排版或质量有问题,则可能导致用户选择的搜索结果的改变。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术问题之一或至少提供一种有用的商业选择。为此,本专利技术的第一个目的在于提出一种准确度高、评估内容全面的浏览质量的评估方法。本专利技术的第二个目的在于提出一种浏览质量的评估装置。为实现上述目的,本专利技术的第一个目的在于提出一种浏览质量的评估方法,包括如下步骤:获取第三方站点的待测页面,并分析所述待测页面以获得第一原始特征集;对所述待测页面进行转码以生成转码后的待测页面,并获得所述待测页面的结构化特征集;对所述转码后的待测页面进行分析以获得第二原始特征集;按照预设的组合规则将所述第一原始特征集、第二原始特征集和所述结构化特征集进行组合以生成组合特征集;以及根据预设的评估模型和所述组合特征集对所述待测页面进行质量评估。根据本专利技术实施例的浏览质量的评估方法,利用提取得到的待测页面的转码前和转码后的特征,以及转码后得到的结构化特征集生成组合特征集,从而表征转码后的页面中各种原始特征的分析结果,利用上述组合特征集和预设的评估模型对页面的质量进行评估,可以实现对页面的排版质量、内容完整性、展现速度等进行 ...
【技术保护点】
一种浏览质量的评估方法,其特征在于,包括:获取第三方站点的待测页面,并分析所述待测页面以获得第一原始特征集;对所述待测页面进行转码以生成转码后的待测页面,并获得所述待测页面的结构化特征集;对所述转码后的待测页面进行分析以获得第二原始特征集;按照预设的组合规则将所述第一原始特征集、第二原始特征集和所述结构化特征集进行组合以生成组合特征集;以及根据预设的评估模型和所述组合特征集对所述待测页面进行质量评估。
【技术特征摘要】
1.一种浏览质量的评估方法,其特征在于,包括:获取第三方站点的待测页面,并分析所述待测页面以获得第一原始特征集,其中,所述第一原始特征集包括转码前的待测页面中的文字、图片、动画的数量和面积信息;对所述待测页面进行转码以生成转码后的待测页面,并获得所述待测页面的结构化特征集,其中,所述结构化特征包括所述待测页面中的标题、图标和联系方式中的一种或多种;对所述转码后的待测页面进行分析以获得第二原始特征集,其中,第二原始特征集包括转码后的待测页面中的文字、图片、动画的数量和面积信息;按照预设的组合规则将所述第一原始特征集、第二原始特征集和所述结构化特征集进行组合以生成组合特征集;以及根据预设的评估模型和所述组合特征集对所述待测页面进行质量评估。2.如权利要求1所述的浏览质量的评估方法,其特征在于,所述评估模型通过以下步骤得到:建立训练样本库,所述训练样本库中包括多个训练样本;对所述训练样本库中的每个训练样本进行特征提取,并生成每个训练样本对应的训练特征集;根据机器学习算法对所述训练特征集进行处理以生成所述评估模型。3.如权利要求2所述的浏览质量的评估方法,其特征在于,所述训练样本包括URL列表和URL列表中每个URL对应的人工评估结果。4.如权利要求1所述的浏览质量的评估方法,其特征在于,还包括:根据所述待测页面的页面类型选择对应的组合规则。5.如权利要求1所述的浏览质量的评估方法,其特征在于,所述获得所述待测页面的结构化特征集进一步包括:对所述待测页面进行结构化分析,以获得所述待测页面的页面类型和内容块;对所述待测页面的内容进行分析以获得所述待测页面的结构化特征。6.一种浏览质量的评估装置,其特征在于,包括:页面获取模块,用于获取第三方站点的待测页面;转码模块,用于对所述待...
【专利技术属性】
技术研发人员:于高,薛林波,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。