The invention provides a click - and - click data acquisition system for web pages, including clients and servers. The client comprises a unique identifier generation module, according to the htmlDOM element on the page and its properties on the page for each click position to generate a unique identifier and a click; additional parameters module, the user clicks on a click position, click on the link address will be added on the click click position only identifies and outputs. The server includes: log collection module, output module parameters obtained from additional users click on the click position and generates the HTTP request in the link address and HTTP request to the headers information in the Referer value; and the data processing module, parse the HTTP request complete link address in a click on the unique identifier, and remove the Referer click a unique identifier does not include, the association to calculate the amount of the click click.
【技术实现步骤摘要】
站内点击位的点击数据获取方法和系统
本专利技术总体上涉及计算机网络,具体地涉及一种站内点击位的点击数据获取方法和系统,更具体地涉及一种基于HTMLDOM以及Referer获取站内点击位点击数据的方法。
技术介绍
用户访问网站时,在页面上各点击位的点击情况对于网站运营者以及网站分析人员至关重要。目前主流的网站统计工具均是通过点击流原理进行统计,在统计用户点击行为时,均需要前置工作。具体地,事先在对应位置进行埋点,用户点击时,将一条点击日志或是浏览日志上报到数据接收服务器进行数据收集。数据计算服务器处理数据后,可以将点击数据及其热度展示到对应的数据产品中。此种方式需要有前置工作,另外调整统计位时仍需额外维护工作,比较麻烦。每次点击都需要额外产生一条日志上报的请求,额外耗费通讯流量。日志产生以及日志上报两个环节都是在前端处理的,部分情况下会影响页面加载性能,并且存在可靠性问题。此外,上报点击日志的方式存在可靠性问题,如遇网络问题或是在未上报日志前关闭页面,均存在丢失情况。
技术实现思路
本专利技术的一个方面提供了一种网页点击位的点击数据获取系统,包括客户端和服务器,其中:客户端包括:唯一标识生成模块,根据网页上的htmlDOM元素以及其属性为网页上每个点击位生成一个点击位唯一标识;以及参数追加模块,在用户点击一点击位时,将被点击的链接地址追加上该点击位的点击位唯一标识并输出;服务器包括:日志收集模块,从参数追加模块的输出获得用户点击该点击位而生成的http请求中的链接地址和http请求的headers信息中的Referer值;以及数据加工模块,解析该http请求的完 ...
【技术保护点】
一种网页点击位的点击数据获取系统,包括客户端和服务器,其中:客户端包括:唯一标识生成模块,根据网页上的html DOM元素以及其属性为网页上每个点击位生成一个点击位唯一标识;以及参数追加模块,在用户点击一点击位时,将被点击的链接地址追加上该点击位的点击位唯一标识并输出;服务器包括:日志收集模块,从参数追加模块的输出获得用户点击该点击位而生成的http请求中的链接地址和http请求的headers信息中的Referer值;以及数据加工模块,解析该http请求的完整链接地址中的点击位唯一标识,并取出Referer值中不包含点击位唯一标识的部分,将两者关联以计算出该点击位的点击量。
【技术特征摘要】
2016.05.30 CN 20161037116251.一种网页点击位的点击数据获取系统,包括客户端和服务器,其中:客户端包括:唯一标识生成模块,根据网页上的htmlDOM元素以及其属性为网页上每个点击位生成一个点击位唯一标识;以及参数追加模块,在用户点击一点击位时,将被点击的链接地址追加上该点击位的点击位唯一标识并输出;服务器包括:日志收集模块,从参数追加模块的输出获得用户点击该点击位而生成的http请求中的链接地址和http请求的headers信息中的Referer值;以及数据加工模块,解析该http请求的完整链接地址中的点击位唯一标识,并取出Referer值中不包含点击位唯一标识的部分,将两者关联以计算出该点击位的点击量。2.根据权利要求1所述的系统,其中唯一标识生成模块生成点击位唯一标识包括:以点击位元素为起点,在html文件中向上找到与该点击位元素距离最近的有唯一属性的元素作为唯一属性元素,如果该点击位元素向上直到根元素都没有具有唯一属性的元素,则该点击位元素相应的唯一属性元素为根元素的下一级元素,如果该点击位元素自身具有唯一属性,则该点击位元素的相应唯一属性元素是它自己;计算出该唯一属性元素与该点击位元素之间有多少个与点击位元素相同的同级元素;以及根据该唯一属性元素、该点击位元素和所述同级元素的数目生成该点击位元素的点击位唯一标识。3.根据权利要求2所述的系统,其中,根据该唯一属性元素、该点击位元素和所述同级元素的数目生成该点击位元素的点击位唯一标识包括:如果一个点击位元素自身不具有唯一属性,则该点击位元素的点击位唯一标识表示为:唯一属性元素的元素名称[唯一属性元素的属性]||该点击位元素名称-同级元素数目;如果该点击位元素自身有唯一属性,则其点击位唯一标识表示为:该点击位元素名称[该点击位元素的属性]。4.根据权利要求1所述的系统,其中,http请求的Referer值表示点击位所在网页的页面。5.根据权利要求1所述的系统,其中,数据加工模块提供以将该http请求的完整链接地址中的点击位唯一标识和Referer值中不包含点击位唯一标识的部分拼接后作为key,将点击量作为value的数据调用接口。6.根据权利要求5所述的系统,还包括:数据展示模块,获取当前网页中已生成的点击位唯一标识,将当前页面链接和点击位唯一标识拼接后作为key调用所述数据调用接口,并展示返...
【专利技术属性】
技术研发人员:吴凯,王海旭,丛金鑫,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。