站内点击位的点击数据获取方法和系统技术方案

技术编号:16755650 阅读:20 留言:0更新日期:2017-12-09 02:08
本发明专利技术提供了一种网页点击位的点击数据获取系统,包括客户端和服务器。客户端包括:唯一标识生成模块,根据网页上的htmlDOM元素以及其属性为网页上每个点击位生成一个点击位唯一标识;以及参数追加模块,在用户点击一点击位时,将被点击的链接地址追加上该点击位的点击位唯一标识并输出。服务器包括:日志收集模块,从参数追加模块的输出获得用户点击该点击位而生成的http请求中的链接地址和http请求的headers信息中的Referer值;以及数据加工模块,解析该http请求的完整链接地址中的点击位唯一标识,并取出Referer值中不包含点击位唯一标识的部分,将两者关联以计算出该点击位的点击量。

Clicking data acquisition method and system in Station Click bit

The invention provides a click - and - click data acquisition system for web pages, including clients and servers. The client comprises a unique identifier generation module, according to the htmlDOM element on the page and its properties on the page for each click position to generate a unique identifier and a click; additional parameters module, the user clicks on a click position, click on the link address will be added on the click click position only identifies and outputs. The server includes: log collection module, output module parameters obtained from additional users click on the click position and generates the HTTP request in the link address and HTTP request to the headers information in the Referer value; and the data processing module, parse the HTTP request complete link address in a click on the unique identifier, and remove the Referer click a unique identifier does not include, the association to calculate the amount of the click click.

【技术实现步骤摘要】
站内点击位的点击数据获取方法和系统
本专利技术总体上涉及计算机网络,具体地涉及一种站内点击位的点击数据获取方法和系统,更具体地涉及一种基于HTMLDOM以及Referer获取站内点击位点击数据的方法。
技术介绍
用户访问网站时,在页面上各点击位的点击情况对于网站运营者以及网站分析人员至关重要。目前主流的网站统计工具均是通过点击流原理进行统计,在统计用户点击行为时,均需要前置工作。具体地,事先在对应位置进行埋点,用户点击时,将一条点击日志或是浏览日志上报到数据接收服务器进行数据收集。数据计算服务器处理数据后,可以将点击数据及其热度展示到对应的数据产品中。此种方式需要有前置工作,另外调整统计位时仍需额外维护工作,比较麻烦。每次点击都需要额外产生一条日志上报的请求,额外耗费通讯流量。日志产生以及日志上报两个环节都是在前端处理的,部分情况下会影响页面加载性能,并且存在可靠性问题。此外,上报点击日志的方式存在可靠性问题,如遇网络问题或是在未上报日志前关闭页面,均存在丢失情况。
技术实现思路
本专利技术的一个方面提供了一种网页点击位的点击数据获取系统,包括客户端和服务器,其中:客户端包括:唯一标识生成模块,根据网页上的htmlDOM元素以及其属性为网页上每个点击位生成一个点击位唯一标识;以及参数追加模块,在用户点击一点击位时,将被点击的链接地址追加上该点击位的点击位唯一标识并输出;服务器包括:日志收集模块,从参数追加模块的输出获得用户点击该点击位而生成的http请求中的链接地址和http请求的headers信息中的Referer值;以及数据加工模块,解析该http请求的完整链接地址中的点击位唯一标识,并取出Referer值中不包含点击位唯一标识的部分,将两者关联以计算出该点击位的点击量。本专利技术还提供了一种网页点击位的点击数据获取方法,包括:根据网页上的htmlDOM元素以及其属性为网页上每个点击位生成一个点击位唯一标识;在用户点击一点击位时,将被点击的链接地址追加上该点击位的点击位唯一标识获得并输出追加结果;从追加结果获得用户点击该点击位而生成的http请求中的链接地址和http请求的headers信息中的Referer值;以及解析该http请求的完整链接地址中的点击位唯一标识,并取出Referer值中不包含点击位唯一标识的部分,将两者关联以计算出该点击位的点击量。可选地,唯一标识生成模块生成点击位唯一标识包括:以点击位元素为起点,在html文件中向上找到与该点击位元素距离最近的有唯一属性的元素作为唯一属性元素,如果该点击位元素向上直到根元素都没有具有唯一属性的元素,则该点击位元素相应的唯一属性元素为根元素的下一级元素,如果该点击位元素自身具有唯一属性,则该点击位元素的相应唯一属性元素是它自己;计算出该唯一属性元素与该点击位元素之间有多少个与点击位元素相同的同级元素;以及根据该唯一属性元素、该点击位元素和所述同级元素的数目生成该点击位元素的点击位唯一标识。可选地,根据该唯一属性元素、该点击位元素和所述同级元素的数目生成该点击位元素的点击位唯一标识包括:如果一个点击位元素自身不具有唯一属性,则该点击位元素的点击位唯一标识表示为:唯一属性元素的元素名称[唯一属性元素的属性]||该点击位元素名称-同级元素数目;如果该点击位元素自身有唯一属性,则其点击位唯一标识表示为:该点击位元素名称[该点击位元素的属性]。可选地,http请求的Referer值表示点击位所在网页的页面。可选地,数据加工模块提供以将该http请求的完整链接地址中的点击位唯一标识和Referer值中不包含点击位唯一标识的部分拼接后作为key,将点击量作为value的数据调用接口。可选地,网页点击位的点击数据获取系统还包括:数据展示模块,获取当前网页中已生成的点击位唯一标识,将当前页面链接和点击位唯一标识拼接后作为key调用所述数据调用接口,并展示返回的点击量数据。可选地,所述客户端包括所述数据展示模块;并且/或者数据展示模块将点击量数据以蒙层形式展示在点击位元素上。附图说明为了更完整地理解本专利技术及其优势,现在将参考结合附图的以下描述,其中:图1示出了根据本专利技术实施例的站内点击位的点击数据获取系统的示意框图。图2示出了根据本专利技术实施例的点击位唯一标识生成原理。图3示出了在网页的点击位元素块上显示点击数据的示意图。具体实施方式根据结合附图对本专利技术示例性实施例的以下详细描述,本专利技术的其它方面、优势和突出特征对于本领域技术人员将变得显而易见。本说明书示意性说明了本专利技术原理。应当理解的是,尽管这里没有明确描述或示出,本领域的技术人员将能够设想体现本专利技术原理并包括在本专利技术精神和范围内的各种布置。这里所记载的所有示例和条件性语言均为了教导的目的,以帮助读者理解本专利技术原理以及专利技术人对现有技术做出贡献的构思,而不会对这里具体记载的示例和条件构成限制。此外,这里对本专利技术的原理、方面、实施例及其特定示例做出记载的所有声明意在包括本专利技术的结构和功能上的等同物。该等同物将包括当前已知的等同物以及将来开发出的等同物,即所开发出来的执行相同功能的任何组件,无论其结构如何。因此,本领域的技术人员可以理解,框图展示出体现本专利技术原理的示意性概念图。可以理解,任何流程、流程图、状态转移图、伪代码等意在表现实质上可以在计算机可读介质上表现的、并且由计算机或处理器执行的各个过程,无论是否明确示出该计算机或处理器。在说明书中涉及本专利技术原理的“一个实施例”或“实施例”及其其他变型是指:结合实施例描述的特定特征、结构、特性等包括在本专利技术的至少一个实施例中。因此,贯穿说明书在不同地方出现的短语“在一个实施例中”或“在实施例中”以及任何其他变型不必均指相同的实施例。应当理解的是,术语“和/或”和“……中的至少一个”的使用,例如在“A和/或B”和“A和B中的至少一个”的情况下,意在包括只选择第一所列项目(A)、或只选择第二所列项目(B)、或选择两个项目(A和B)。作为另一示例,在“A、B和/或C”和“A、B和C中的至少一个”的情况下,这样的表示意在包括只选择第一所列项目(A)、或只选择第二所列项目(B)、或只选择第三所列项目(C)、或只选择第一和第二所列项目(A和B)、或只选择第一和第三所列项目(A和C)、或只选择第二和第三所列项目(B和C)、或选择所有三个项目(A和B和C)。对于本领域和相关领域的普通技术人员来说显而易见的是,对于所列的许多项目,上述内容是可以扩展的。在本专利技术中,术语“包括”和“含有”及其派生词意为包括而非限制;术语“或”是包含性的,意为和/或。在本说明书中,下述用于描述本专利技术原理的各种实施例只是说明,不应该以任何方式解释为限制专利技术的范围。参照附图的下述描述用于帮助全面理解由权利要求及其等同物限定的本专利技术的示例性实施例。下述描述包括多种具体细节来帮助理解,但这些细节应认为仅仅是示例性的。因此,本领域普通技术人员应认识到,在不背离本专利技术的范围和精神的情况下,可以对本文中描述的实施例进行多种改变和修改。此外,为了清楚和简洁起见,省略了公知功能和结构的描述。此外,贯穿附图,相同参考数字用于相似功能和操作。图1示出了根据本专利技术实施例的站内点击位的点击数据获取系统的示意框图。该系统包括客户端10和服本文档来自技高网...
站内点击位的点击数据获取方法和系统

【技术保护点】
一种网页点击位的点击数据获取系统,包括客户端和服务器,其中:客户端包括:唯一标识生成模块,根据网页上的html DOM元素以及其属性为网页上每个点击位生成一个点击位唯一标识;以及参数追加模块,在用户点击一点击位时,将被点击的链接地址追加上该点击位的点击位唯一标识并输出;服务器包括:日志收集模块,从参数追加模块的输出获得用户点击该点击位而生成的http请求中的链接地址和http请求的headers信息中的Referer值;以及数据加工模块,解析该http请求的完整链接地址中的点击位唯一标识,并取出Referer值中不包含点击位唯一标识的部分,将两者关联以计算出该点击位的点击量。

【技术特征摘要】
2016.05.30 CN 20161037116251.一种网页点击位的点击数据获取系统,包括客户端和服务器,其中:客户端包括:唯一标识生成模块,根据网页上的htmlDOM元素以及其属性为网页上每个点击位生成一个点击位唯一标识;以及参数追加模块,在用户点击一点击位时,将被点击的链接地址追加上该点击位的点击位唯一标识并输出;服务器包括:日志收集模块,从参数追加模块的输出获得用户点击该点击位而生成的http请求中的链接地址和http请求的headers信息中的Referer值;以及数据加工模块,解析该http请求的完整链接地址中的点击位唯一标识,并取出Referer值中不包含点击位唯一标识的部分,将两者关联以计算出该点击位的点击量。2.根据权利要求1所述的系统,其中唯一标识生成模块生成点击位唯一标识包括:以点击位元素为起点,在html文件中向上找到与该点击位元素距离最近的有唯一属性的元素作为唯一属性元素,如果该点击位元素向上直到根元素都没有具有唯一属性的元素,则该点击位元素相应的唯一属性元素为根元素的下一级元素,如果该点击位元素自身具有唯一属性,则该点击位元素的相应唯一属性元素是它自己;计算出该唯一属性元素与该点击位元素之间有多少个与点击位元素相同的同级元素;以及根据该唯一属性元素、该点击位元素和所述同级元素的数目生成该点击位元素的点击位唯一标识。3.根据权利要求2所述的系统,其中,根据该唯一属性元素、该点击位元素和所述同级元素的数目生成该点击位元素的点击位唯一标识包括:如果一个点击位元素自身不具有唯一属性,则该点击位元素的点击位唯一标识表示为:唯一属性元素的元素名称[唯一属性元素的属性]||该点击位元素名称-同级元素数目;如果该点击位元素自身有唯一属性,则其点击位唯一标识表示为:该点击位元素名称[该点击位元素的属性]。4.根据权利要求1所述的系统,其中,http请求的Referer值表示点击位所在网页的页面。5.根据权利要求1所述的系统,其中,数据加工模块提供以将该http请求的完整链接地址中的点击位唯一标识和Referer值中不包含点击位唯一标识的部分拼接后作为key,将点击量作为value的数据调用接口。6.根据权利要求5所述的系统,还包括:数据展示模块,获取当前网页中已生成的点击位唯一标识,将当前页面链接和点击位唯一标识拼接后作为key调用所述数据调用接口,并展示返...

【专利技术属性】
技术研发人员:吴凯王海旭丛金鑫
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1