网站访问路径的聚合方法和装置制造方法及图纸

技术编号:15437261 阅读:185 留言:0更新日期:2017-05-25 19:25
本申请公开了一种网站访问路径的聚合方法和装置。其中,该方法包括:获取目标用户在第一预设时间段内每次访问目标网站时的访问信息,其中,目标用户为至少一个;获取每条访问信息中包含的一个或多个属性信息,并将每条访问信息中包含的一个或多个属性信息在关系型数据库中按行存储;对每个目标用户对应的目标属性信息进行处理,得到每个目标用户的访问路径;将每条访问路径作为一条记录存储到关系型数据库中;利用关系型数据库中的聚合函数对多条记录进行聚合,得到聚合结果。通过本申请,解决了现有技术中只能对有限长度的访问路径进行聚合,而无法对任意长度的访问路径进行聚合的问题。

Method and apparatus for aggregation of web access paths

The present application discloses a method and a device for polymerizing a web access path. Among them, the method includes: obtaining the target users in the first preset each access to information, the target site during periods of time in which the target user for at least one; for one or more attribute information contained in each access information, and each access to one or more attribute information contained in the press rows are stored in a relational database; processing the target attribute information corresponding to each user, get access to the path of each target user; each access path as a record stored in the relational database; the multiple records aggregate relational database using aggregate functions in the polymerization results. Through this application, the problem that aggregation of any length of access path can not be achieved in existing techniques can be aggregated only for access paths of finite length.

【技术实现步骤摘要】
网站访问路径的聚合方法和装置
本申请涉及计算机领域,具体而言,涉及一种网站访问路径的聚合方法和装置。
技术介绍
一般来说,网站的访问日志通常被转化后存储在关系型数据库中,数据库中的每条记录代表用户的一次访问。由于网站的访问路径中包含了用户一系列连续的有目的的动作行为,所以对网站的分析可以通过分析网站的访问路径实现。现有技术中,通过如下过程得到某个用户对某网站的访问路径:首先找出该用户在一段时间内对该网站的所有访问,然后逐条分析该用户的每次访问,并将每次访问中的路径节点一列一列的存储在关系型数据库中,最后对上述一列一列存储在数据库中的路径节点进行处理,以得到上述用户关于某个网站的访问路径。在得到每个用户关于该网站的访问路径后,分析每一条访问路径,是非常容易的。但是由于用户的访问路径通常是海量的,逐条分析,不仅效率低下,也没法分析出网站的用户群体的访问路径分析出用户行为,这就需要对访问路径进行加工处理,把在一定条件下相同的多个访问路径聚合成一条,以用于对网站进行分析。但是,由于受到关系型数据库中列数、数据类型等因素的影响,现有技术中只能对有限长度的访问路径进行聚合,而无法对任意长度的访问路径进行聚合。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种网站访问路径的聚合方法和装置,以至少现有技术中只能对有限长度的访问路径进行聚合,而无法对任意长度的访问路径进行聚合的问题。根据本申请实施例的一个方面,提供了一种网站访问路径的聚合方法,包括:获取目标用户在第一预设时间段内每次访问目标网站时的访问信息,其中,所述目标用户为至少一个;获取每条所述访问信息中包含的一个或多个属性信息,并将每条所述访问信息中包含的一个或多个属性信息在关系型数据库中按行存储,其中,所述属性信息用于表征访问路径的路径节点;对每个所述目标用户对应的目标属性信息进行处理,得到每个所述目标用户的访问路径,其中,每个所述目标属性信息由从每条所述访问信息中获取到的所述一个或多个属性信息中的至少之一组成;将每条所述访问路径作为一条记录存储到所述关系型数据库中;以及利用所述关系型数据库中的聚合函数对多条所述记录进行聚合,得到聚合结果。进一步地,在获取目标用户在第一预定时间段内每次访问目标网站时的访问信息之前,所述方法还包括:从所述目标网站的访问日志中,获取在第二预设时间段内访问过所述目标网站的用户,作为所述目标用户。进一步地,获取每条所述访问信息中包含的一个或多个属性信息,并将每条所述访问信息中包含的一个或多个属性信息在关系型数据库中按行存储包括:按照访问信息中包含的访问时间对目标用户Ai的访问信息进行排序,其中,i依次取1至n,n为所述目标用户的数量;从目标用户Ai的排序后的访问信息中,依次获取每条所述访问信息中包含的身份标识信息以及一个或者多个属性信息;将从所述目标用户Ai的每条所述访问信息中获取到的所述身份标识信息以及一个或者多个属性信息按行逐条存储在所述关系型数据库中。进一步地,每个所述目标用户对应多个所述目标属性信息,其中,对每个所述目标用户对应的目标属性信息进行处理,得到每个所述目标用户的访问路径包括:将目标用户Ai对应的多个目标属性信息中任意相邻的两个所述目标属性信息通过预设符号串联连接,其中,i依次取1至n,n为所述目标用户的数量;将所述目标用户Ai的串联后的目标属性信息作为所述目标用户Ai的访问路径。进一步地,将目标用户Ai对应的多个目标属性信息中任意相邻的两个所述目标属性信息通过预设符号串联连接包括:获取所述目标用户Ai对应的多个目标属性信息;判断所述目标用户Ai对应的目标属性信息Ai(j-1)与目标属性信息Ai(j)是否相同,其中,j依次取2至m(i)-2,m(i)为所述目标用户Ai对应的目标属性信息的数量;在判断出所述目标属性信息Ai(j-1)与所述目标属性信息Ai(j)不相同的情况下,将所述目标属性信息Ai(j-1)与所述目标属性信息Ai(j)通过所述预设符号连接;在判断出所述目标属性信息Ai(j-1)与所述目标属性信息Ai(j)相同的情况下,删除所述目标属性信息Ai(j-1),并判断所述目标属性信息Ai(j)与目标属性信息Ai(j+1)是否相同;在判断出所述目标属性信息Ai(j)与所述目标属性信息Ai(j+1)不相同的情况下,将所述目标属性信息Ai(j)与所述目标属性信息Ai(j+1)通过所述预设符号连接。进一步地,所述属性信息包括来源类型、来源渠道、浏览器类型、操作系统类型和搜索引擎。根据本申请实施例的另一方面,提供了一种用于网站访问路径的聚合装置,包括:第一获取单元,用于获取目标用户在第一预设时间段内每次访问目标网站时的访问信息,其中,所述目标用户为至少一个;第二获取单元,用于获取每条所述访问信息中包含的一个或多个属性信息,并将每条所述访问信息中包含的一个或多个属性信息在关系型数据库中按行存储,其中,所述属性信息用于表征访问路径的路径节点;处理单元,用于对每个所述目标用户对应的目标属性信息进行处理,得到每个所述目标用户的访问路径,其中,每个所述目标属性信息由从每条所述访问信息中获取到的所述一个或多个属性信息中的至少之一组成;存储单元,用于将每条所述访问路径作为一条记录存储到所述关系型数据库中;以及聚合单元,用于利用所述关系型数据库中的聚合函数对多条所述记录进行聚合,得到聚合结果。进一步地,所述装置还包括:第三获取单元,用于在获取目标用户在第一预定时间段内每次访问目标网站时的访问信息之前,从所述目标网站的访问日志中,获取在第二预设时间段内访问过所述目标网站的用户,作为所述目标用户。进一步地,所述第二获取单元包括:排序子单元,用于按照访问信息中包含的访问时间对目标用户Ai的访问信息进行排序,其中,i依次取1至n,n为所述目标用户的数量;获取子单元,用于从目标用户Ai的排序后的访问信息中,依次获取每条所述访问信息中包含的身份标识信息以及一个或者多个属性信息;存储子单元,用于将从所述目标用户Ai的每条所述访问信息中获取到的所述身份标识信息以及一个或者多个属性信息按行逐条存储在所述关系型数据库中。进一步地,每个所述目标用户对应多个所述目标属性信息,其中,所述处理单元包括:连接子单元,用于将目标用户Ai对应的多个目标属性信息中任意相邻的两个所述目标属性信息通过预设符号串联连接,其中,i依次取1至n,n为所述目标用户的数量;确定子单元,用于将所述目标用户Ai的串联后的目标属性信息作为所述目标用户Ai的访问路径。在本申请实施例中,采用获取目标用户在第一预设时间段内每次访问所述目标网站时的访问信息,其中,所述目标用户为至少一个;获取每条所述访问信息中包含的一个或多个属性信息,并将每条所述访问信息中包含的一个或多个属性信息在关系型数据库中按行存储,其中,所述属性信息用于表征访问路径的路径节点;对每个所述目标用户对应的目标属性信息进行处理,得到每个所述目标用户的访问路径,其中,每个所述目标属性信息由从每条所述访问信息中获取到的所述一个或多个属性信息中的至少之一组成;以及将每条所述访问路径作为一条记录存储到所述关系型数据库中;以及利用所述关系型数据库中的聚合函数对多条所述记录进行聚合,得到本文档来自技高网...
网站访问路径的聚合方法和装置

【技术保护点】
一种网站访问路径的聚合方法,其特征在于,包括:获取目标用户在第一预设时间段内每次访问目标网站时的访问信息,其中,所述目标用户为至少一个;获取每条所述访问信息中包含的一个或多个属性信息,并将每条所述访问信息中包含的一个或多个属性信息在关系型数据库中按行存储,其中,所述属性信息用于表征访问路径的路径节点;对每个所述目标用户对应的目标属性信息进行处理,得到每个所述目标用户的访问路径,其中,每个所述目标属性信息由从每条所述访问信息中获取到的所述一个或多个属性信息中的至少之一组成;将每条所述访问路径作为一条记录存储到所述关系型数据库中;以及利用所述关系型数据库中的聚合函数对多条所述记录进行聚合,得到聚合结果。

【技术特征摘要】
1.一种网站访问路径的聚合方法,其特征在于,包括:获取目标用户在第一预设时间段内每次访问目标网站时的访问信息,其中,所述目标用户为至少一个;获取每条所述访问信息中包含的一个或多个属性信息,并将每条所述访问信息中包含的一个或多个属性信息在关系型数据库中按行存储,其中,所述属性信息用于表征访问路径的路径节点;对每个所述目标用户对应的目标属性信息进行处理,得到每个所述目标用户的访问路径,其中,每个所述目标属性信息由从每条所述访问信息中获取到的所述一个或多个属性信息中的至少之一组成;将每条所述访问路径作为一条记录存储到所述关系型数据库中;以及利用所述关系型数据库中的聚合函数对多条所述记录进行聚合,得到聚合结果。2.根据权利要求1所述的方法,其特征在于,在获取目标用户在第一预定时间段内每次访问目标网站时的访问信息之前,所述方法还包括:从所述目标网站的访问日志中,获取在第二预设时间段内访问过所述目标网站的用户,作为所述目标用户。3.根据权利要求1所述的方法,其特征在于,获取每条所述访问信息中包含的一个或多个属性信息,并将每条所述访问信息中包含的一个或多个属性信息在关系型数据库中按行存储包括:按照访问信息中包含的访问时间对目标用户Ai的访问信息进行排序,其中,i依次取1至n,n为所述目标用户的数量;从目标用户Ai的排序后的访问信息中,依次获取每条所述访问信息中包含的身份标识信息以及一个或者多个属性信息;将从所述目标用户Ai的每条所述访问信息中获取到的所述身份标识信息以及一个或者多个属性信息按行逐条存储在所述关系型数据库中。4.根据权利要求1所述的方法,其特征在于,每个所述目标用户对应多个所述目标属性信息,其中,对每个所述目标用户对应的目标属性信息进行处理,得到每个所述目标用户的访问路径包括:将目标用户Ai对应的多个目标属性信息中任意相邻的两个所述目标属性信息通过预设符号串联连接,其中,i依次取1至n,n为所述目标用户的数量;将所述目标用户Ai的串联后的目标属性信息作为所述目标用户Ai的访问路径。5.根据权利要求4所述的方法,其特征在于,将目标用户Ai对应的多个目标属性信息中任意相邻的两个所述目标属性信息通过预设符号串联连接包括:获取所述目标用户Ai对应的多个目标属性信息;判断所述目标用户Ai对应的目标属性信息Ai(j-1)与目标属性信息Ai(j)是否相同,其中,j依次取2至m(i)-2,m(i)为所述目标用户Ai对应的目标属性信息的数量;在判断出所述目标属性信息Ai(j-1)与所述目标属性信息Ai(j)不相同的情况下,将所述目标属性信息Ai(j-1)与所述目标属性信息Ai(j)通...

【专利技术属性】
技术研发人员:詹晓强
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1