用于网页页面点击量统计的数据处理方法和装置制造方法及图纸

技术编号:9642495 阅读:109 留言:0更新日期:2014-02-07 01:09
本发明专利技术公开了一种用于网页页面点击量统计的数据处理方法和装置。该用于网页页面点击量统计的数据处理方法包括:获取被监测网页页面的坐标系;通过坐标系记录所述网页页面上的点击量;通过点击量确定网页页面上的热点区域;计算热点区域覆盖的坐标位置个数和网页页面的全页面坐标位置个数;以及将热点区域覆盖的坐标位置个数与网页页面的全页面坐标位置个数的比值作为网页页面的热点密度。解决了相关技术中缺少对网页页面各个点的点击量统计的问题,进而达到了自动统计网页页面点击的热点密度的效果。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种用于网页页面点击量统计的数据处理方法和装置。该用于网页页面点击量统计的数据处理方法包括:获取被监测网页页面的坐标系;通过坐标系记录所述网页页面上的点击量;通过点击量确定网页页面上的热点区域;计算热点区域覆盖的坐标位置个数和网页页面的全页面坐标位置个数;以及将热点区域覆盖的坐标位置个数与网页页面的全页面坐标位置个数的比值作为网页页面的热点密度。解决了相关技术中缺少对网页页面各个点的点击量统计的问题,进而达到了自动统计网页页面点击的热点密度的效果。【专利说明】用于网页页面点击量统计的数据处理方法和装置
本专利技术涉及数据处理领域,具体而言,涉及一种用于网页页面点击量统计的数据处理方法和装置。
技术介绍
目前,在相关技术中,网页页面点击热点技术多与热点的视觉展现及热点区域的信息关联,该网页页面点击热点技术的主要实现手段如下:(1)构建网页页面的坐标系;记录点击坐标位置;(3)将点击坐标位置与相关信息进行关联,其中,相关技术的上述方案缺少对网页页面各个点的点击量统计。针对相关技术中缺少对网页页面各个点的点击量统计的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种用于网页页面点击量统计的数据处理方法和装置,以解决相关技术中缺少对网页页面各个点的点击量统计的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种用于网页页面点击量统计的数据处理方法。该方法包括:获取被监测网页页面的坐标系;通过坐标系记录网页页面上的点击量;通过点击量确定网页页面上的热点区域;计算热点区域覆盖的坐标位置个数和网页页面的全页面坐标位置个数;以及将热点区域覆盖的坐标位置个数与网页页面的全页面坐标位置个数的比值作为网页页面的热点密度。进一步地,通过点击量确定网页页面上的热点区域包括:获取点击量的密度大于预定阈值的区域;以及将获取的区域作为热点区域。进一步地,获取点击量的密度大于预定阈值的区域包括:在网页页面的二维平面空间中,任选一个点,然后以点为圆心,r为半径做圆,其中,落在圆内的所有被点击点与圆心都会产生一个向量,向量是以圆心为起点,以落在圆内的被点击的点为终点,向量包括一个或者多个;将一个或者多个向量相加,得到均值飘移Meanshift向量;判断Meanshift向量的模是否小于预设极值;当判断出Meanshift向量的模小于预设极值时,则通过Meanshift向量获取点击量的密度和独立连续区域;判断点击量的密度是否大于预定阈值;以及在独立连续区域中获取点击量的密度大于预定阈值的区域。进一步地,通过以下方式获取点击量的密度:获取独立连续区域中各个区域的点击次数;以及将点击次数除以对应的区域得到对应的区域的点击量密度。进一步地,通过以下方式得到独立连续区域:对网页页面内的圆心坐标位置进行分类汇总;以及将网页页面内指向相同终点的坐标集合所构成的区域记录为独立连续区域的一个区域。为了实现上述目的,根据本专利技术的另一方面,提供了一种用于网页页面点击量统计的数据处理装置。该装置包括:获取单元,用于获取被监测网页页面的坐标系;记录单元,用于通过坐标系记录网页页面上的点击量;确定单元,用于通过点击量确定网页页面上的热点区域;第一计算单元,用于计算热点区域覆盖的坐标位置个数和网页页面的全页面坐标位置个数;以及第二计算单元,用于将热点区域覆盖的坐标位置个数与网页页面的全页面坐标位置个数的比值作为网页页面的热点密度。进一步地,确定单元包括:获取模块,用于获取点击量的密度大于预定阈值的区域;以及确定模块,用于将获取的区域作为热点区域。进一步地,获取模块包括:向量处理子模块,用于在网页页面的二维平面空间中,任选一个点,然后以点为圆心,r为半径做圆,其中,落在圆内的所有被点击的点与圆心都会产生一个向量,向量是以圆心为起点,以落在圆内的被点击的点为终点,向量包括一个或者多个;均值子模块,用于将多个向量相加,得到均值飘移Meanshift向量;第一判断子模块,用于判断Meanshift向量的模是否小于预设极值;第一获取子模块,用于当判断出Meanshift向量的模小于预设极值时,贝U通过Meanshift向量获取点击量的密度和独立连续区域;第二判断子模块,用于判断点击量的密度是否大于预定阈值;以及第二获取子模块,用于在独立连续区域中获取点击量的密度大于预定阈值的区域。进一步地,获取模块用于获取独立连续区域中各个区域的点击次数,将点击次数除以对应的区域得到对应的区域的点击量密度。进一步地,获取模块用于对网页页面内的圆心坐标位置进行分类汇总,将网页页面内指向相同终点的坐标集合所构成的区域记录为独立连续区域的一个区域。通过本专利技术,采用获取被监测网页页面的坐标系;通过坐标系记录网页页面上的点击量;通过点击量确定网页页面上的热点区域;计算热点区域覆盖的坐标位置个数和网页页面的全页面坐标位置个数;以及将热点区域覆盖的坐标位置个数与网页页面的全页面坐标位置个数的比值作为网页页面的热点密度,解决了相关技术中缺少对网页页面各个点的点击量统计的问题,进而达到了自动统计网页页面点击的热点密度的效果。【专利附图】【附图说明】构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术第一实施例的用于网页页面点击量统计的数据处理装置的示意图;图2是根据本专利技术第二实施例的用于网页页面点击量统计的数据处理装置的示意图;图3是根据本专利技术第一实施例的用于网页页面点击量统计的数据处理方法的流程图;以及图4是根据本专利技术第二实施例的用于网页页面点击量统计的数据处理方法的流程图。【具体实施方式】需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。为了使本领域的技术人员更好的理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,在本领域普通技术人员没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术的保护范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。根据本专利技术的实施例,提供了一种用于网页页面点击量统计的数据处理装置,该装置用于统计网页页面点击量以得到网页页面点击热点密度。图1是根据本专利技术第一实施例的用于网页页面点击量统计的数据处理装置的示意图。如图1所示,该装置包括:获取单元10、记录单元20、确定单元30、第一计算单元40和第二计算单元50。获取单元10用于获取被监测网页页面的坐标系。在本专利技术实施例中,网页可以是多中平台下和多种浏览器下的网页,坐标系可以是正交直角坐标系。获取单元10用于获取被监测网页页面的坐标系包括获取正交直角坐标系的坐标原点、坐标横轴(本文档来自技高网...

【技术保护点】
一种用于网页页面点击量统计的数据处理方法,其特征在于,包括:获取被监测网页页面的坐标系;通过所述坐标系记录所述网页页面上的点击量;通过所述点击量确定所述网页页面上的热点区域;计算所述热点区域覆盖的坐标位置个数和所述网页页面的全页面坐标位置个数;以及将所述热点区域覆盖的坐标位置个数与所述网页页面的全页面坐标位置个数的比值作为所述网页页面的热点密度。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘合翔何鑫
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1