The invention discloses a web page quality detection method and device. Including the detection method of the quality of web pages: Web information acquisition target web page, the web page information to the target web page information; the quality grade of the target web page is determined by the information; and the target web page quality is determined by the quality grade, tested according to the quality of web page information on the web structure or content. The invention solves the problem that the quality of the webpage is not accurate, and further, the effect of accurately detecting the quality of the web page is achieved.
【技术实现步骤摘要】
网页质量检测方法和装置
本专利技术涉及互联网领域,具体而言,涉及一种网页质量检测方法和装置。
技术介绍
随着互联网的发展,数据已经渗透到大量的行业和业务职能领域,以网页形式出现的互联网数据正在快速地增长。网页的质量直接影响到用户的浏览兴趣,网络营销的效果等。现有的网页质量检测方案是采用用户数据进行检测,即利用浏览网页的用户给出的评价信息以及这些用户在网页上的行为,如停留时间、热力图等信息进行检测。这种做法要求获取大量的用户数据,对用户数据进行清洗过滤,再在这些数据的基础上进行分析计算。在用户数据的数据量较少的情况下,这种检测方案的质量将得不到保证,但是数据量大也将增加计算的复杂度。现有的网页质量检测方案存在着如下问题:一方面,用户数据的获取是动态的,且对用户数据计算和处理过程需要大量的时间与软硬件的支持;另一方面,网页是动态变化的,历史的用户数据与当前的网页质量并没有直接的关系,这部分数据不能用于评估当前网页的质量;另外,用户的对网页的评价主要依赖用户的主观判断,存在一定的主观因素。上述问题都会影响网页质量的检测的准确性。针对现有技术中网页质量检测不准确的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种网页质量检测方法和装置,以解决网页质量检测不准确的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种网页质量检测方法。根据本专利技术的网页质量检测方法包括:获取目标网页的网页信息,网页信息为目标网页的页面上的信息;由网页信息确定目标网页的质量等级;由质量等级确定目标网页的网页质量。进一步地,获取目标网页的网页信息包括: ...
【技术保护点】
一种网页质量检测方法,其特征在于,包括:获取目标网页的网页信息,所述网页信息为所述目标网页的页面上的信息;由所述网页信息确定所述目标网页的质量等级;以及由所述质量等级确定所述目标网页的网页质量。
【技术特征摘要】
1.一种网页质量检测方法,其特征在于,包括:获取目标网页的网页信息,所述网页信息为所述目标网页的页面上的信息;由所述网页信息确定所述目标网页的质量等级;以及由所述质量等级确定所述目标网页的网页质量,其中,获取目标网页的网页信息包括:获取所述目标网页的网页特征;获取所述目标网页的父节点,所述父节点为由出链指向所述目标网页的网页;由所述网页信息获取所述目标网页的质量等级包括:获取所述网页特征的质量分值,所述质量分值为用于反映所述目标网页的网页质量的数值;获取所述父节点的认可分值,所述认可分值为用于反映所述父节点对所述目标网页的认可程度的数值;由所述质量分值和所述认可分值确定所述目标网页的质量等级;由所述质量分值和所述认可分值确定所述目标网页的质量等级包括:获取所述认可分值在所述目标网页的质量中所占的比例;通过公式SW=F*d+S*(1-d)计算所述目标网页的总分值,其中SW为所述总分值,F为所述认可分值,d为所述认可分值在所述目标网页的质量中所占的比例,S为所述质量分值;如果所述目标网页的总分值超过设定阈值,确定所述目标网页为第一质量等级;以及如果所述目标网页的总分值未超过设定阈值,确定所述目标网页为第二质量等级。2.根据权利要求1所述的网页质量检测方法,其特征在于,获取目标网页的网页信息包括:获取所述目标网页的网页特征;由所述网页信息获取所述目标网页的质量等级包括:获取所述网页特征对应的质量分值,所述质量分值为用于反映所述目标网页的网页质量的数值;由所述质量分值确定所述目标网页的质量等级。3.根据权利要求2所述的网页质量检测方法,其特征在于,获取所述目标网页的网页特征包括获取目标网页的结构特征和内容特征,所述结构特征为用于表示所述目标网页的结构的特征,所述内容特征为用于表示所述目标网页的内容的特征,其中,获取所述网页特征对应的质量分值包括:获取第一质量分值和第二质量分值,其中,第一质量分值为用于反映所述目标网页结构特征的质量数值,所述第二质量分值为用于反映所述目标网页内容特征的质量数值;以及将所述第一质量分值与所述第二质量分值相加得到所述网页特征的质量分值。4.一种网页质量检测装置,其特征在于,包括:获取单元,用于获取目标网页的网页信息,所述网页信息为...
【专利技术属性】
技术研发人员:郭凯敏,何恺铎,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。