一种对用户行为数据进行漏斗分析方法及装置制造方法及图纸

技术编号:19177443 阅读:39 留言:0更新日期:2018-10-17 00:23
本发明专利技术实施例提供了一种对用户行为数据进行漏斗分析方法及装置,其中方法包括:针对每个用户,获取根据应用场景预定义的一个一维数组,元素按预设行为的顺序存储预设行为的时间戳;获取行为序列中第一次出现的第一个预设行为的时间戳填入第一个元素中;若获取的行为序列中的下一个行为是第一个预设行为,则将该行为的时间戳填入第一个元素中;若该行为是第N个预设行为,获取的第N‑1个元素中第一时间戳,与第N个预设行为的时间戳在同一时间窗口内,则将该第一时间戳,填入第N个元素中;将停止在元素中填入时间戳的当前一维数组中,已填入时间戳的元素的个数,作为最长的执行行为数量,以计算第N‑1个预设行为向第N个预设行为进行转化的转化率。

Funnel analysis method and device for user behavior data

The embodiment of the invention provides a funnel analysis method and a device for user behavior data, wherein the method comprises: for each user, acquiring a one-dimensional array predefined according to the application scenario, elements storing a timestamp of the preset behavior in the order of the preset behavior, and acquiring a first occurrence in the behavior sequence. The timestamp of a default behavior is filled in the first element; if the next behavior in the acquired behavior sequence is the first default behavior, the timestamp of the behavior is filled in the first element; if the behavior is the N default behavior, the first timestamp of the acquired N_1 element, and the timestamp of the N default behavior In the same time window, the first timestamp is filled in the N element; the number of elements that have been filled in the timestamp in the current one-dimensional array stopped filling in the element is taken as the longest number of execution actions to calculate the conversion rate of the N_1 default behavior to the N_1 default behavior.

【技术实现步骤摘要】
一种对用户行为数据进行漏斗分析方法及装置
本专利技术涉及数据分析
,特别是涉及一种对用户行为数据进行漏斗分析方法及装置。
技术介绍
目前,通常采用漏斗分析方法对用户行为数据进行分析,以监控用户是否按照预定义的行为进行转化,寻找每个转化过程中的可优化行为。一般来讲,用户行为都是按照预设的行为顺序执行的,例如:按照顺序执行:第一行为A,第二行为B,第三行为C,第四行为D······,第M行为X,M大于或等于5。比如,如图1所示,若应用场景为用户操作购物网页,则A是选购商品,B是添加购物车,C是去购物车结算,D是核对订单信息······,X是完成支付。操作购物网页的用户一般数量众多,每个用户执行行为都不尽相同,例如:用户可能是按照所定义的行为顺序,多次只执行其部分行为或者全部行为。利用这些用户所执行行为,通过如下步骤对用户行为数据进行分析,确定前一行为向后一行为转化的转化率。首先,获取用户操作购物网页的用户总数量及每个用户行为执行数据;然后,获取每个用户所执行多个行为中一组最长执行行为;再然后,针对所有用户的最长执行行为,统计执行第一行为的用户总数,第二行为的用户总数、······,以及第M行为X的用户总数;最后,将后一行为的用户总数,与上一行为的用户总数之比,作为前一行为向后一行为转化的转化率,流失率为1减去转化率的差。如图1所示,执行A行为的用户总数为1000,执行B行为的用户总数为600,执行C行为的用户总数为450,A行为向B行为的转化率为60%,B行为向C行为的转化率为75%,C行为向D的转化率为50%。因此,在计算预定义的行为进行转化时的流失率及转化率之前,需要统计出每个用户的一组最长的执行行为数量。然而,专利技术人在实现本专利技术的过程中,发现现有技术中确定每个用户的一组最长的执行行为数量,至少存在如下问题:目前,在确定出每个用户的一组最长的执行行为数量过程中,需要针对每个用户的每一次行为都遍历一次所有的用户行为执行数据。也就是每个行为的总数量,决定了空间复杂度为O(n),其中O(n)为空间复杂度函数,n为每个行为的总数量。也就是说,现有技术这种通过多次遍历所有用户行为数据,来确定出每个用户的一组最长的执行行为数量的方法空间复杂度较高,导致了现有技术数据分析的效率较低。
技术实现思路
本专利技术实施例的目的在于提供一种对用户行为数据进行漏斗分析方法及装置,以提高数据分析的效率。具体技术方案如下:第一方面,本专利技术实施例提供了一种对用户行为数据进行漏斗分析方法,针对每个用户,所述方法包括:获取根据应用场景预定义的一个一维数组,所述一维数组包含与所述应用场景预设行为数量相同的元素;用于按所述应用场景预设行为的顺序存储预设行为的时间戳,一个元素存储一个时间戳;获取行为序列,其中,所述行为序列是按照所述用户执行行为完成的时间戳的先后顺序进行排序,生成的序列;获取所述行为序列中,第一次出现的应用场景的第一个预设行为的时间戳填入所述一维数组的第一个元素中;获取所述行为序列中的下一个行为,作为当前行为;如果当前行为是第一个预设行为,则将当前行为的时间戳,填入所述一维数组的第一个元素中;如果当前行为是非第一个预设行为的第N个预设行为,则获取第N-1个元素中存在的第一时间戳,所述N表示个数,N的取值为大于或等于2的整数;判断所述第一时间戳与所述第N个预设行为的时间戳是否处于同一时间窗口内;若所述第一时间戳与所述第N个预设行为的时间戳处于同一时间窗口内,则将所述第N-1个元素中存在的第一时间戳,填入所述一维数组的第N个元素中;判断是否停止在所述元素中填入时间戳;若不停止在所述元素中填入时间戳,则返回所述获取所述行为序列中的下一个行为,作为当前行为的步骤;若停止在所述元素中填入时间戳,则停止在所述元素中填入时间戳,将当前一维数组中,已填入时间戳的元素的个数,作为最长的执行行为数量;基于最长的执行行为数量,计算第N-1个预设行为向第N个预设行为进行转化的转化率。进一步的,在所述获取行为序列中的下一个行为,作为当前行为之后,所述方法还包括:如果当前行为是非第一个预设行为的第N个预设行为,且第N-1个元素中不存在时间戳,则返回所述获取所述行为序列中的下一个行为,作为当前行为的步骤。进一步的,所述判断所述第一时间戳与所述第N个预设行为的时间戳是否处于同一时间窗口内,包括:判断所述第一时间戳与所述第N个预设行为的时间戳之间的时间差是否小于预设阈值;如果所述第一时间戳与所述第N个预设行为的时间戳之间的时间差小于预设阈值,则处于同一时间窗口内;否则,不处于同一时间窗内。进一步的,所述判断是否停止在所述元素中填入时间戳,包括:判断所述第一数组中的每个元素是否已填入时间戳;如果所述第一数组中的每个元素填入时间戳,则确定停止在所述元素中填入时间戳;如果所述第一数组中的每个元素没有填入时间戳,则判断是否已经读取完所述用户的所述行为序列中的所有行为;如果已经读取完所述用户的所述行为序列中的所有行为,则确定停止在所述元素中填入时间戳;如果未读取完所述用户的所述行为序列中的所有行为,则确定不停止在所述元素中填入时间戳。进一步的,所述用户执行行为是携带预设页面内容的用户执行行为。第二方面,本专利技术实施例提供了一种对用户行为数据进行漏斗分析装置,针对每个用户,所述装置包括:第一获取模块,用于获取根据应用场景预定义的一个一维数组,所述一维数组包含与所述应用场景预设行为数量相同的元素;用于按所述应用场景预设行为的顺序存储预设行为的时间戳,一个元素存储一个时间戳;第二获取模块,用于获取行为序列,其中,所述行为序列是按照所述用户执行行为完成的时间戳的先后顺序进行排序,生成的序列;第三获取模块,用于获取所述行为序列中,第一次出现的应用场景的第一个预设行为的时间戳填入所述一维数组的第一个元素中;第四获取模块,用于获取所述行为序列中的下一个行为,作为当前行为;填入模块,用于如果当前行为是第一个预设行为,则将当前行为的时间戳,填入所述一维数组的第一个元素中;第五获取模块,用于如果当前行为是非第一个预设行为的第N个预设行为,则获取第N-1个元素中存在的第一时间戳,所述N表示个数,N的取值为大于或等于2的整数;第一判断模块,用于判断所述第一时间戳与所述第N个预设行为的时间戳是否处于同一时间窗口内;若所述第一时间戳与所述第N个预设行为的时间戳处于同一时间窗口内,则将所述第N-1个元素中存在的第一时间戳,填入所述一维数组的第N个元素中;第二判断模块,用于判断是否停止在所述元素中填入时间戳;若不停止在所述元素中填入时间戳,则返回所述获取所述行为序列中的下一个行为,作为当前行为的步骤;若停止在所述元素中填入时间戳,则停止在所述元素中填入时间戳,将当前一维数组中,已填入时间戳的元素的个数,作为最长的执行行为数量;计算模块,用于基于最长的执行行为数量,计算第N-1个预设行为向第N个预设行为进行转化的转化率。进一步的,所述装置还包括:第三判断模块,用于在所述获取行为序列中的下一个行为,作为当前行为之后,如果当前行为是非第一个预设行为的第N个预设行为,且第N-1个元素中不存在时间戳,则返回所述获取所述行为序列中的下一个行为,作为当前行为的步骤。进一步的,所述第一判断模块,具体用于:判断本文档来自技高网
...

【技术保护点】
1.一种对用户行为数据进行漏斗分析方法,其特征在于,针对每个用户,所述方法包括:获取根据应用场景预定义的一个一维数组,所述一维数组包含与所述应用场景预设行为数量相同的元素;用于按所述应用场景预设行为的顺序存储预设行为的时间戳,一个元素存储一个时间戳;获取行为序列,其中,所述行为序列是按照所述用户执行行为完成的时间戳的先后顺序进行排序,生成的序列;获取所述行为序列中,第一次出现的应用场景的第一个预设行为的时间戳填入所述一维数组的第一个元素中;获取所述行为序列中的下一个行为,作为当前行为;如果当前行为是第一个预设行为,则将当前行为的时间戳,填入所述一维数组的第一个元素中;如果当前行为是非第一个预设行为的第N个预设行为,则获取第N‑1个元素中存在的第一时间戳,所述N表示个数,N的取值为大于或等于2的整数;判断所述第一时间戳与所述第N个预设行为的时间戳是否处于同一时间窗口内;若所述第一时间戳与所述第N个预设行为的时间戳处于同一时间窗口内,则将所述第N‑1个元素中存在的第一时间戳,填入所述一维数组的第N个元素中;判断是否停止在所述元素中填入时间戳;若不停止在所述元素中填入时间戳,则返回所述获取所述行为序列中的下一个行为,作为当前行为的步骤;若停止在所述元素中填入时间戳,则停止在所述元素中填入时间戳,将当前一维数组中,已填入时间戳的元素的个数,作为最长的执行行为数量;基于最长的执行行为数量,计算第N‑1个预设行为向第N个预设行为进行转化的转化率。...

【技术特征摘要】
1.一种对用户行为数据进行漏斗分析方法,其特征在于,针对每个用户,所述方法包括:获取根据应用场景预定义的一个一维数组,所述一维数组包含与所述应用场景预设行为数量相同的元素;用于按所述应用场景预设行为的顺序存储预设行为的时间戳,一个元素存储一个时间戳;获取行为序列,其中,所述行为序列是按照所述用户执行行为完成的时间戳的先后顺序进行排序,生成的序列;获取所述行为序列中,第一次出现的应用场景的第一个预设行为的时间戳填入所述一维数组的第一个元素中;获取所述行为序列中的下一个行为,作为当前行为;如果当前行为是第一个预设行为,则将当前行为的时间戳,填入所述一维数组的第一个元素中;如果当前行为是非第一个预设行为的第N个预设行为,则获取第N-1个元素中存在的第一时间戳,所述N表示个数,N的取值为大于或等于2的整数;判断所述第一时间戳与所述第N个预设行为的时间戳是否处于同一时间窗口内;若所述第一时间戳与所述第N个预设行为的时间戳处于同一时间窗口内,则将所述第N-1个元素中存在的第一时间戳,填入所述一维数组的第N个元素中;判断是否停止在所述元素中填入时间戳;若不停止在所述元素中填入时间戳,则返回所述获取所述行为序列中的下一个行为,作为当前行为的步骤;若停止在所述元素中填入时间戳,则停止在所述元素中填入时间戳,将当前一维数组中,已填入时间戳的元素的个数,作为最长的执行行为数量;基于最长的执行行为数量,计算第N-1个预设行为向第N个预设行为进行转化的转化率。2.如权利要求1所述的方法,其特征在于,在所述获取行为序列中的下一个行为,作为当前行为之后,所述方法还包括:如果当前行为是非第一个预设行为的第N个预设行为,且第N-1个元素中不存在时间戳,则返回所述获取所述行为序列中的下一个行为,作为当前行为的步骤。3.如权利要求1或2所述的方法,其特征在于,所述判断所述第一时间戳与所述第N个预设行为的时间戳是否处于同一时间窗口内,包括:判断所述第一时间戳与所述第N个预设行为的时间戳之间的时间差是否小于预设阈值;如果所述第一时间戳与所述第N个预设行为的时间戳之间的时间差小于预设阈值,则处于同一时间窗口内;否则,不处于同一时间窗内。4.如权利要求1或2所述的方法,其特征在于,所述判断是否停止在所述元素中填入时间戳,包括:判断所述第一数组中的每个元素是否已填入时间戳;如果所述第一数组中的每个元素填入时间戳,则确定停止在所述元素中填入时间戳;如果所述第一数组中的每个元素没有填入时间戳,则判断是否已经读取完所述用户的所述行为序列中的所有行为;如果已经读取完所述用户的所述行为序列中的所有行为,则确定停止在所述元素中填入时间戳;如果未读取完所述用户的所述行为序列中的所有行为,则确定不停止在所述元素中填入时间戳。5.如权利要求1或2所述的方法,其特征在于,所述用户执行行为是携带预设页面内容的用户执行行为。6.一种对用户行为数据进行漏斗分析装置,其特征在于,针对每个用户,所述装置包括:第一获取模块,用于获取根据应用场景预定义的...

【专利技术属性】
技术研发人员:刘军刘芳姜亦朋卢跃凯叶健东
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1