The invention discloses a method and a device for reducing and recommending traffic data. Among them, the method includes: extracting data flow to be reduced on the target site all the referral traffic data; get all the promotion removed outside the set of flow data to be reduced to the first referral traffic flow data from the first data; to promote traffic data collection, data searching and data flow to be reduced to match second to promote the flow of data collection; access to the shortest interval third referral traffic data from the second data set for referral traffic and the reduction of traffic data; third referral traffic data and traffic data and to be reduced, with traffic data to be reduced by reduction. The invention solves the technical problem that the source of the traffic data after the failure of the customer terminal cookie or the deletion of the cookie is mistakenly counted as the data of the recommendation flow generated from the self access of the target site.
【技术实现步骤摘要】
还原推介流量数据的方法和装置
本专利技术涉及网站分析领域,具体而言,涉及一种还原推介流量数据的方法和装置。
技术介绍
目前,很多商家都在通过各式各样的网络用户行为分析的方法的用户流量浏览网站的行为习惯进行分析,以网络用户行为的分析结果作为改进网站布局和增加访问量等商业目的重要数据来源。作为目前主流的网站分析方法,页面标签数据采集技术常常被使用在对网站的流量分析中;网站流量的主要来源类型有直接流量、搜索流量以及推介流量,推介流量是指用户通过非键入目标网站的网址方式和通过非搜索引擎的其他网站来到目的网站所产生的流量,因此查找推介流量的流量来源,可以知晓目的网站当前的推介方法对目的网站是否适用,并且网站开发人员可以根据推介流量的统计结果对网站进行进一步的改进,故推介流量的流量来源值得深入分析。在使用页面标签数据采集技术分析网络用户行为时,是利用访问流量中的cookie数据对用户行为进行统计分析的,然而在实际统计分析的过程中,由于cookie的可清除性和实效性,会导致部分来自于非搜索引擎的其他网站的推介流量数据会被误统计为来自于目标网站本身的流量数据。例如当用户通过非搜索引擎的其他网站进入目标网站后,进行了清除cookie的操作,当用户在目标网站包含的页面进行其他访问时,由于之前的cookie已经被清除,因此服务器会为清除cookie数据之后的访问流量数据重新分配cookie数据,然而新的cookie数据的字段中记录此部分流量数据的来源是目标网站本身,而不是这段流量数据的真正来源,故新的cookie数据会导致流量的来源被误统计。针对在访问终端通过访问非搜索引擎的其 ...
【技术保护点】
一种还原推介流量数据的方法,其特征在于,包括:在目标网站的全部推介流量数据中,提取待还原的流量数据,其中,所述待还原的流量数据包括:访问所述目标网站的当前访问界面中的内容,以及所述当前访问界面中的子界面的内容所产生的流量数据;获取所述全部推介流量数据中除去所述待还原的流量数据之外的第一推介流量数据集合;从所述第一推介流量数据集合中,查找与所述待还原的流量数据的数据参数相匹配的第二推介流量数据集合,其中,所述数据参数包括:cookie字段、流量来源的设备属性和/或访问所述目标网站的过程中记录的最后一个访问页面;从所述第二推介流量数据集合中查找与所述待还原的流量数据中访问所述目标网站间隔最短的第三推介流量数据;将所述第三推介流量数据与所述待还原的流量数据进行合并,以还原所述待还原的流量数据。
【技术特征摘要】
1.一种还原推介流量数据的方法,其特征在于,包括:在目标网站的全部推介流量数据中,提取待还原的流量数据,其中,所述待还原的流量数据包括:访问所述目标网站的当前访问界面中的内容,以及所述当前访问界面中的子界面的内容所产生的流量数据;获取所述全部推介流量数据中除去所述待还原的流量数据之外的第一推介流量数据集合;从所述第一推介流量数据集合中,查找与所述待还原的流量数据的数据参数相匹配的第二推介流量数据集合,其中,所述数据参数包括:cookie字段、流量来源的设备属性和/或访问所述目标网站的过程中记录的最后一个访问页面;从所述第二推介流量数据集合中查找与所述待还原的流量数据中访问所述目标网站间隔最短的第三推介流量数据;将所述第三推介流量数据与所述待还原的流量数据进行合并,以还原所述待还原的流量数据。2.根据权利要求1所述的方法,其特征在于,从所述第一推介流量数据集合中查找与所述待还原的流量数据的数据参数相匹配的第二推介流量数据集合,包括:将所述待还原的流量数据的cookie字段与所述第一推介流量数据集合中包含的每个推介流量数据的cookie字段进行比对;从所述第一推介流量数据集合中筛选得到多个与所述待还原的流量数据的cookie字段一致的推介流量数据;获取所述待还原的流量数据包含的首个访问界面的地址信息和筛选得到的多个推介流量数据中记录的最后一个访问界面的地址信息;判断所述筛选得到的多个推介流量数据中记录的所述最后一个访问页面的地址信息与所述待还原的流量数据中的所述首个访问界面的地址信息是否相同;在所述多个推介流量数据中记录的所述最后一个访问页面的地址信息与所述首个访问界面的地址信息相同的情况下,确认所述筛选得到的多个推介流量数据中地址信息相同的推介流量数据构成所述第二推介流量数据集合。3.根据权利要求1所述的方法,其特征在于,从所述第一推介流量数据集合中查找与所述待还原的流量数据的数据参数相匹配的第二推介流量数据集合包括:将所述待还原的流量数据的cookie字段与所述第一推介流量数据集合中包含的每个推介流量数据的cookie字段进行比对;从所述第一推介流量数据集合中筛选得到多个与所述待还原的流量数据的cookie字段不一致的推介流量数据;从所述多个与所述待还原的流量数据的cookie字段不一致的推介流量数据中筛选得到设备属性相同的多个推介流量数据;获取所述待还原的流量数据包含的首个访问界面的地址信息和筛选得到的所述多个推介流量数据中记录的最后一个访问界面的地址信息;判断筛选得到的所述多个推介流量数据中记录的最后一个访问页面的地址信息与所述待还原的流量数据中的所述首个访问界面的地址信息是否相同;在所述多个推介流量数据中记录的最后一个访问页面的地址信息与所述首个访问界面的地址信息相同的情况下,确认筛选得到的所述多个推介流量数据中地址信息相同的推介流量数据构成所述第二推介流量数据集合。4.根据权利要求1所述的方法,其特征在于,从所述第二推介流量数据集合中查找与所述待还原的流量数据中访问所述目标网站间隔最短的第三推介流量数据,包括:获取所述待还原的流量数据包含的首个访问界面的会话开始时间;获取所述第二推介流量数据集合中包含的每个推介流量数据中记录最后访问界面的会话结束时间;计算所述首个访问界面的会话开始时间与每个最后访问界面的会话结束时间的时间间隔;将所述第二推介流量数据集合中对应的访问所述目标网站间隔最短的推介流量数据作为所述第三推介流量数据。5.根据权利要求1所述的方法,其特征在于,在目标网站的全部推介流量数据中提取待还原的流量数据,包括:获取所述全部推介流量数据的来源主机名;判断所述全部推介流量数据的来源主机名是否包含所述目标网站的网站域名或所述目标网站的兄弟网站的网站域名;确认所述来源主机名包含所述目标网站或所述目标网站的兄弟网站的网站域名的所述...
【专利技术属性】
技术研发人员:胡立芳,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。