网页质量检测方法和装置制造方法及图纸

技术编号:9618391 阅读:76 留言:0更新日期:2014-01-30 06:14
本发明专利技术公开了一种网页质量检测方法和装置。该网页质量检测方法包括:获取目标网页的网页信息,该网页信息为目标网页的页面上的信息;由网页信息确定目标网页的质量等级;以及由质量等级确定目标网页的网页质量,根据网页页面上的信息对网页自身的结构或者内容的质量进行检测。通过本发明专利技术,解决了网页质量检测不准确的问题,进而达到了准确检测网页质量的效果。

Web page quality detecting method and device

The invention discloses a web page quality detection method and device. Including the detection method of the quality of web pages: Web information acquisition target web page, the web page information to the target web page information; the quality grade of the target web page is determined by the information; and the target web page quality is determined by the quality grade, tested according to the quality of web page information on the web structure or content. The invention solves the problem that the quality of the webpage is not accurate, and further, the effect of accurately detecting the quality of the web page is achieved.

【技术实现步骤摘要】
网页质量检测方法和装置
本专利技术涉及互联网领域,具体而言,涉及一种网页质量检测方法和装置。
技术介绍
随着互联网的发展,数据已经渗透到大量的行业和业务职能领域,以网页形式出现的互联网数据正在快速地增长。网页的质量直接影响到用户的浏览兴趣,网络营销的效果等。现有的网页质量检测方案是采用用户数据进行检测,即利用浏览网页的用户给出的评价信息以及这些用户在网页上的行为,如停留时间、热力图等信息进行检测。这种做法要求获取大量的用户数据,对用户数据进行清洗过滤,再在这些数据的基础上进行分析计算。在用户数据的数据量较少的情况下,这种检测方案的质量将得不到保证,但是数据量大也将增加计算的复杂度。现有的网页质量检测方案存在着如下问题:一方面,用户数据的获取是动态的,且对用户数据计算和处理过程需要大量的时间与软硬件的支持;另一方面,网页是动态变化的,历史的用户数据与当前的网页质量并没有直接的关系,这部分数据不能用于评估当前网页的质量;另外,用户的对网页的评价主要依赖用户的主观判断,存在一定的主观因素。上述问题都会影响网页质量的检测的准确性。针对现有技术中网页质量检测不准确的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种网页质量检测方法和装置,以解决网页质量检测不准确的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种网页质量检测方法。根据本专利技术的网页质量检测方法包括:获取目标网页的网页信息,网页信息为目标网页的页面上的信息;由网页信息确定目标网页的质量等级;由质量等级确定目标网页的网页质量。进一步地,获取目标网页的网页信息包括:获取目标网页的网页特征。由网页信息获取目标网页的质量等级包括:获取网页特征对应的质量分值,质量分值为用于反映目标网页的网页质量的数值;由质量分值确定目标网页的质量等级。进一步地,获取目标网页的网页特征包括获取目标网页的结构特征和内容特征,结构特征为用于表示目标网页的结构的特征,内容特征为用于表示目标网页的内容的特征,其中,获取网页特征对应的质量分值包括:获取第一质量分值和第二质量分值,其中,第一质量分值为用于反映目标网页结构特征的质量数值,第二质量分值为用于反映目标网页内容特征的质量数值;以及将第一质量分值与第二质量分值相加得到网页特征的质量分值。进一步地,获取目标网页的网页信息包括:获取目标网页的网页特征;获取目标网页的父节点,父节点为由出链指向目标网页的网页。由网页信息获取目标网页的质量等级包括:获取网页特征的质量分值,质量分值为用于反映目标网页的网页质量的数值;获取父节点的认可分值,认可分值为用于反映父节点对目标网页的认可程度的数值;由质量分值和认可分值确定目标网页的质量等级。进一步地,由质量分值和认可分值确定目标网页的质量等级包括:获取认可分值在目标网页的质量中所占的比例;通过公式SW=F*d+S*(1-d)计算目标网页的总分值,其中SW为总分值,F为认可分值,d为认可分值在目标网页的质量中所占的比例,S为质量分值;如果目标网页的总分值超过设定阈值,确定目标网页为第一质量等级;以及如果目标网页的总分值未超过设定阈值,确定目标网页为第二质量等级。为了实现上述目的,根据本专利技术的另一方面,提供了一种网页质量检测装置。根据本专利技术的网页质量检测装置包括:获取单元,用于获取目标网页的网页信息,网页信息为目标网页的页面上的信息;第一确定单元,用于由网页信息确定目标网页的质量等级;以及第二确定单元,用于由质量等级确定目标网页的网页质量。进一步地,获取单元包括:第一获取模块,用于获取目标网页的网页特征。第一确定单元包括:第二获取模块,用于获取网页特征对应的质量分值,质量分值为用于反映目标网页的网页质量的数值;第一确定模块,用于由质量分值确定目标网页的质量等级。进一步地,第一获取模块用于获取目标网页的结构特征和内容特征,结构特征为用于表示目标网页的结构的特征,内容特征为用于表示目标网页的内容的特征,其中,第二获取模块包括:第一获取子模块,用于获取第一质量分值和第二质量分值,其中,第一质量分值为用于反映目标网页结构特征的质量数值,第二质量分值为用于反映目标网页内容特征的质量数值;以及第一计算子模块,用于将第一质量分值与第二质量分值相加得到网页特征的质量分值。进一步地,获取单元包括:第三获取模块,用于获取目标网页的网页特征;第三获取模块还用于获取目标网页的父节点,父节点为由出链指向目标网页的网页。第一确定单元包括:第四获取模块,用于获取网页特征的质量分值,质量分值为用于反映目标网页的网页质量的数值;第四获取模块还用于获取父节点的认可分值,认可分值为用于反映父节点对目标网页的认可程度的数值;第二确定模块,用于由质量分值和认可分值确定目标网页的质量等级。进一步地,第二确定模块包括:第二获取子模块,用于获取认可分值在目标网页的质量中所占的比例;第二计算子模块,用于通过公式SW=F*d+S*(1-d)计算目标网页的总分值,其中SW为总分值,F为认可分值,d为认可分值在目标网页的质量中所占的比例,S为质量分值;第一确定子模块,用于如果目标网页的总分值超过设定阈值,确定目标网页为第一质量等级;以及第二确定子模块,用于如果目标网页的总分值未超过设定阈值,确定目标网页为第二质量等级。通过本专利技术,采用网页质量检测方法包括:获取目标网页的网页信息,该网页信息为目标网页的页面上的信息;由网页信息确定目标网页的质量等级;以及由质量等级确定目标网页的网页质量,根据网页页面上的信息对网页自身的结构或者内容的质量进行检测,避免了由于用户数据的不确定性对网页质量检测的影响,解决了网页质量检测不准确的问题,进而达到了准确检测网页质量的效果。附图说明构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术第一实施例的网页质量检测装置的结构示意图;图2是根据本专利技术第二实施例的网页质量检测装置的结构示意图;图3是根据本专利技术第三实施例的网页质量检测装置的结构示意图;图4是根据本专利技术第一实施例的网页质量检测方法的流程图;图5是根据本专利技术第二实施例的网页质量检测方法的流程图;图6是根据本专利技术第三实施例的网页质量检测方法的流程图;以及图7是根据本专利技术第四实施例的网页质量检测方法的流程图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。本专利技术实施例提供了一种网页质量检测装置,该装置可以通过计算机设备实现其功能。图1是根据本专利技术第一实施例的网页质量检测装置的结构示意图。如图1所示,该装置包括获取单元10、第一确定单元20和第二确定单元30。获取单元10用于获取目标网页的网页信息,该网页信息为目标网页的页面上的信息。目标网页为需要进行质量检测的网页,目标网页可以是任意一个网页,也可以是多个网页,可以是任意一个网站中的任意一个网页,也可以是一个单独的网页。获取单元10获取的目标网页上的网页信息,该网页信息可以是反映目标网页结构的信息,可以是反映目标网页内容的信息,也可以是目标网页的父节点的信息,目标网页的父节点为由出链指向目标网页的网页。例如,本文档来自技高网...
网页质量检测方法和装置

【技术保护点】
一种网页质量检测方法,其特征在于,包括:获取目标网页的网页信息,所述网页信息为所述目标网页的页面上的信息;由所述网页信息确定所述目标网页的质量等级;以及由所述质量等级确定所述目标网页的网页质量。

【技术特征摘要】
1.一种网页质量检测方法,其特征在于,包括:获取目标网页的网页信息,所述网页信息为所述目标网页的页面上的信息;由所述网页信息确定所述目标网页的质量等级;以及由所述质量等级确定所述目标网页的网页质量,其中,获取目标网页的网页信息包括:获取所述目标网页的网页特征;获取所述目标网页的父节点,所述父节点为由出链指向所述目标网页的网页;由所述网页信息获取所述目标网页的质量等级包括:获取所述网页特征的质量分值,所述质量分值为用于反映所述目标网页的网页质量的数值;获取所述父节点的认可分值,所述认可分值为用于反映所述父节点对所述目标网页的认可程度的数值;由所述质量分值和所述认可分值确定所述目标网页的质量等级;由所述质量分值和所述认可分值确定所述目标网页的质量等级包括:获取所述认可分值在所述目标网页的质量中所占的比例;通过公式SW=F*d+S*(1-d)计算所述目标网页的总分值,其中SW为所述总分值,F为所述认可分值,d为所述认可分值在所述目标网页的质量中所占的比例,S为所述质量分值;如果所述目标网页的总分值超过设定阈值,确定所述目标网页为第一质量等级;以及如果所述目标网页的总分值未超过设定阈值,确定所述目标网页为第二质量等级。2.根据权利要求1所述的网页质量检测方法,其特征在于,获取目标网页的网页信息包括:获取所述目标网页的网页特征;由所述网页信息获取所述目标网页的质量等级包括:获取所述网页特征对应的质量分值,所述质量分值为用于反映所述目标网页的网页质量的数值;由所述质量分值确定所述目标网页的质量等级。3.根据权利要求2所述的网页质量检测方法,其特征在于,获取所述目标网页的网页特征包括获取目标网页的结构特征和内容特征,所述结构特征为用于表示所述目标网页的结构的特征,所述内容特征为用于表示所述目标网页的内容的特征,其中,获取所述网页特征对应的质量分值包括:获取第一质量分值和第二质量分值,其中,第一质量分值为用于反映所述目标网页结构特征的质量数值,所述第二质量分值为用于反映所述目标网页内容特征的质量数值;以及将所述第一质量分值与所述第二质量分值相加得到所述网页特征的质量分值。4.一种网页质量检测装置,其特征在于,包括:获取单元,用于获取目标网页的网页信息,所述网页信息为...

【专利技术属性】
技术研发人员:郭凯敏何恺铎
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1