还原推介流量数据的方法和装置制造方法及图纸

技术编号:15394912 阅读:38 留言:0更新日期:2017-05-19 06:36
本发明专利技术公开了一种还原推介流量数据的方法和装置。其中,该方法包括:在目标网站的全部推介流量数据中提取待还原的流量数据;获取全部推介流量数据中除去待还原的流量数据之外的第一推介流量数据集合;从第一推介流量数据集合中,查找与待还原的流量数据的数据参数相匹配的第二推介流量数据集合;从第二推介流量数据集合中查找与待还原的流量数据中访问间隔最短的第三推介流量数据;将第三推介流量数据与待还原的流量数据进行合并,以还原待还原的流量数据。本发明专利技术解决了在客户终端cookie失效后或删除cookie后的流量数据的来源被误统计为来自于目标网站自身访问所产生的推介流量数据的技术问题。

Method and device for reducing and recommending traffic data

The invention discloses a method and a device for reducing and recommending traffic data. Among them, the method includes: extracting data flow to be reduced on the target site all the referral traffic data; get all the promotion removed outside the set of flow data to be reduced to the first referral traffic flow data from the first data; to promote traffic data collection, data searching and data flow to be reduced to match second to promote the flow of data collection; access to the shortest interval third referral traffic data from the second data set for referral traffic and the reduction of traffic data; third referral traffic data and traffic data and to be reduced, with traffic data to be reduced by reduction. The invention solves the technical problem that the source of the traffic data after the failure of the customer terminal cookie or the deletion of the cookie is mistakenly counted as the data of the recommendation flow generated from the self access of the target site.

【技术实现步骤摘要】
还原推介流量数据的方法和装置
本专利技术涉及网站分析领域,具体而言,涉及一种还原推介流量数据的方法和装置。
技术介绍
目前,很多商家都在通过各式各样的网络用户行为分析的方法的用户流量浏览网站的行为习惯进行分析,以网络用户行为的分析结果作为改进网站布局和增加访问量等商业目的重要数据来源。作为目前主流的网站分析方法,页面标签数据采集技术常常被使用在对网站的流量分析中;网站流量的主要来源类型有直接流量、搜索流量以及推介流量,推介流量是指用户通过非键入目标网站的网址方式和通过非搜索引擎的其他网站来到目的网站所产生的流量,因此查找推介流量的流量来源,可以知晓目的网站当前的推介方法对目的网站是否适用,并且网站开发人员可以根据推介流量的统计结果对网站进行进一步的改进,故推介流量的流量来源值得深入分析。在使用页面标签数据采集技术分析网络用户行为时,是利用访问流量中的cookie数据对用户行为进行统计分析的,然而在实际统计分析的过程中,由于cookie的可清除性和实效性,会导致部分来自于非搜索引擎的其他网站的推介流量数据会被误统计为来自于目标网站本身的流量数据。例如当用户通过非搜索引擎的其他网站进入目标网站后,进行了清除cookie的操作,当用户在目标网站包含的页面进行其他访问时,由于之前的cookie已经被清除,因此服务器会为清除cookie数据之后的访问流量数据重新分配cookie数据,然而新的cookie数据的字段中记录此部分流量数据的来源是目标网站本身,而不是这段流量数据的真正来源,故新的cookie数据会导致流量的来源被误统计。针对在访问终端通过访问非搜索引擎的其他网站提供的链接地址进入目标网站之后,由于访问终端中保存的本地访问的cookie的时效性限制或用户清除该cookie,使得继续访问该目标网站中的内容时,网络服务器产生的新cookie中未记录该目标网站的原始来源,导致当前继续访问该目标网站中的内容所产生的流量数据被误统计为来自于目标网站自身访问所产生的推介流量数据的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种还原推介流量数据的方法和装置,以至少解决在访问终端通过访问非搜索引擎的其他网站提供的链接地址进入目标网站之后,由于cookie的时效性限制或用户清除该cookie,使得继续访问该目标网站中的内容时,网络服务器产生的新cookie中未记录该目标网站的原始来源,导致在cookie失效后或删除cookie后的流量数据的来源被误统计为来自于目标网站自身访问所产生的推介流量数据的技术问题。根据本专利技术实施例的一个方面,提供了一种还原推介流量的方法,包括:在目标网站的全部推介流量数据中提取待还原的流量数据,其中,待还原的流量数据包括:访问目标网站的当前访问界面中的内容以及当前访问界面中的子界面的内容所产生的流量数据;获取全部推介流量数据中除去待还原的流量数据之外的第一推介流量数据集合;从第一推介流量数据集合中,查找与待还原的流量数据的数据参数相匹配的第二推介流量数据集合,其中,数据参数包括:cookie字段、流量来源的设备属性和/或访问目标网站的过程中记录的最后一个访问页面;从第二推介流量数据集合中查找与待还原的流量数据中访问目标网站间隔最短的第三推介流量数据;将第三推介流量数据与待还原的流量数据进行合并,以还原待还原的流量数据。根据本专利技术实施例的另一方面,还提供了一种还原推介流量的裝置,包括:提取模块,用于在目标网站的全部推介流量数据中提取待还原的流量数据,其中,待还原的流量数据包括访问目标网站的当前访问界面中的内容以及当前访问界面中的子界面的内容所产生的流量数据;第一获取模块,用于获取全部推介流量数据中除去待还原的流量数据之外的第一推介流量数据集合;第一查找模块,用于从第一推介流量数据集合中查找与待还原的流量数据的数据参数相匹配的第二推介流量数据集合,其中,数据参数包括:cookie字段、流量来源的设备属性和/或访问目标网站的过程中记录的最后一个访问页面;第二查找模块,用于从第二推介流量数据集合中查找与待还原的流量数据中访问目标网站间隔最短的第三推介流量数据;合并模块,用于将第三推介流量数据与待还原的流量数据进行合并,以还原待还原的流量数据。在本专利技术实施例中,采用从目标网站的全毕业推介流量在中提取待还原的流量数据的方式,通过比对待还原的流量数据的数据参数和除待还原的流量数据以外的其余推介流量数据的数据参数,达到了从除待还原的流量数据以外的其余推介流量数据中根据筛选条件逐层筛选查找待还原的流量数据原所属的推介流量数据的目的,从而实现了待还原的流量数据与其原所属的流量数据合并的技术效果,进一步的使待还原的流量数据根据其流量来源进行还原的技术效果,进而解决了在访问终端通过访问非搜索引擎的其他网站提供的链接地址进入目标网站之后,由于cookie的时效性限制或用户清除该cookie,使得继续访问该目标网站中的内容时,网络服务器产生的新cookie中未记录该目标网站的原始来源,导致在cookie失效后或删除cookie后的流量数据的来源被误统计为来自于目标网站自身访问所产生的推介流量数据的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种还原推介流量数据的方法的流程图;图2是根据本专利技术实施例的一种可选的还原推介流量数据的方法的流程图;图3是根据本专利技术实施例的一种还原推介流量数据的装置的示意图;图4是根据本专利技术实施例的一种可选的还原推介流量数据的装置的示意图;图5是根据本专利技术实施例的一种可选的还原推介流量数据的装置的示意图;图6是根据本专利技术实施例的一种可选的还原推介流量数据的装置的示意图;图7是根据本专利技术实施例的一种可选的还原推介流量数据的装置的示意图;图8是根据本专利技术实施例的一种可选的还原推介流量数据的装置的示意图;以及图9是根据本专利技术实施例的一种可选的还原推介流量数据的装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面对本申请涉及到的名词解释如下:cookie:是服务器暂时存放在上网用户的电脑里的资料,即一种文本文件,以便让服务器能够识别网络用户身本文档来自技高网
...
还原推介流量数据的方法和装置

【技术保护点】
一种还原推介流量数据的方法,其特征在于,包括:在目标网站的全部推介流量数据中,提取待还原的流量数据,其中,所述待还原的流量数据包括:访问所述目标网站的当前访问界面中的内容,以及所述当前访问界面中的子界面的内容所产生的流量数据;获取所述全部推介流量数据中除去所述待还原的流量数据之外的第一推介流量数据集合;从所述第一推介流量数据集合中,查找与所述待还原的流量数据的数据参数相匹配的第二推介流量数据集合,其中,所述数据参数包括:cookie字段、流量来源的设备属性和/或访问所述目标网站的过程中记录的最后一个访问页面;从所述第二推介流量数据集合中查找与所述待还原的流量数据中访问所述目标网站间隔最短的第三推介流量数据;将所述第三推介流量数据与所述待还原的流量数据进行合并,以还原所述待还原的流量数据。

【技术特征摘要】
1.一种还原推介流量数据的方法,其特征在于,包括:在目标网站的全部推介流量数据中,提取待还原的流量数据,其中,所述待还原的流量数据包括:访问所述目标网站的当前访问界面中的内容,以及所述当前访问界面中的子界面的内容所产生的流量数据;获取所述全部推介流量数据中除去所述待还原的流量数据之外的第一推介流量数据集合;从所述第一推介流量数据集合中,查找与所述待还原的流量数据的数据参数相匹配的第二推介流量数据集合,其中,所述数据参数包括:cookie字段、流量来源的设备属性和/或访问所述目标网站的过程中记录的最后一个访问页面;从所述第二推介流量数据集合中查找与所述待还原的流量数据中访问所述目标网站间隔最短的第三推介流量数据;将所述第三推介流量数据与所述待还原的流量数据进行合并,以还原所述待还原的流量数据。2.根据权利要求1所述的方法,其特征在于,从所述第一推介流量数据集合中查找与所述待还原的流量数据的数据参数相匹配的第二推介流量数据集合,包括:将所述待还原的流量数据的cookie字段与所述第一推介流量数据集合中包含的每个推介流量数据的cookie字段进行比对;从所述第一推介流量数据集合中筛选得到多个与所述待还原的流量数据的cookie字段一致的推介流量数据;获取所述待还原的流量数据包含的首个访问界面的地址信息和筛选得到的多个推介流量数据中记录的最后一个访问界面的地址信息;判断所述筛选得到的多个推介流量数据中记录的所述最后一个访问页面的地址信息与所述待还原的流量数据中的所述首个访问界面的地址信息是否相同;在所述多个推介流量数据中记录的所述最后一个访问页面的地址信息与所述首个访问界面的地址信息相同的情况下,确认所述筛选得到的多个推介流量数据中地址信息相同的推介流量数据构成所述第二推介流量数据集合。3.根据权利要求1所述的方法,其特征在于,从所述第一推介流量数据集合中查找与所述待还原的流量数据的数据参数相匹配的第二推介流量数据集合包括:将所述待还原的流量数据的cookie字段与所述第一推介流量数据集合中包含的每个推介流量数据的cookie字段进行比对;从所述第一推介流量数据集合中筛选得到多个与所述待还原的流量数据的cookie字段不一致的推介流量数据;从所述多个与所述待还原的流量数据的cookie字段不一致的推介流量数据中筛选得到设备属性相同的多个推介流量数据;获取所述待还原的流量数据包含的首个访问界面的地址信息和筛选得到的所述多个推介流量数据中记录的最后一个访问界面的地址信息;判断筛选得到的所述多个推介流量数据中记录的最后一个访问页面的地址信息与所述待还原的流量数据中的所述首个访问界面的地址信息是否相同;在所述多个推介流量数据中记录的最后一个访问页面的地址信息与所述首个访问界面的地址信息相同的情况下,确认筛选得到的所述多个推介流量数据中地址信息相同的推介流量数据构成所述第二推介流量数据集合。4.根据权利要求1所述的方法,其特征在于,从所述第二推介流量数据集合中查找与所述待还原的流量数据中访问所述目标网站间隔最短的第三推介流量数据,包括:获取所述待还原的流量数据包含的首个访问界面的会话开始时间;获取所述第二推介流量数据集合中包含的每个推介流量数据中记录最后访问界面的会话结束时间;计算所述首个访问界面的会话开始时间与每个最后访问界面的会话结束时间的时间间隔;将所述第二推介流量数据集合中对应的访问所述目标网站间隔最短的推介流量数据作为所述第三推介流量数据。5.根据权利要求1所述的方法,其特征在于,在目标网站的全部推介流量数据中提取待还原的流量数据,包括:获取所述全部推介流量数据的来源主机名;判断所述全部推介流量数据的来源主机名是否包含所述目标网站的网站域名或所述目标网站的兄弟网站的网站域名;确认所述来源主机名包含所述目标网站或所述目标网站的兄弟网站的网站域名的所述...

【专利技术属性】
技术研发人员:胡立芳
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1