一种数据处理方法及装置制造方法及图纸

技术编号:16301340 阅读:39 留言:0更新日期:2017-09-26 19:26
本发明专利技术实施例公开了一种数据处理方法及装置,所述方法包括:获取各个用户在预设时间段内对于预设客户端的用户行为数据,用户行为数据包括用户对预设客户端的访问信息;对用户行为数据进行数据切片,得到至少两组数据单元,各组数据单元的数据长度相同;在至少两组数据单元中确定目标数据单元;根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数;根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期。采用本发明专利技术实施例,可准确预测用户的生命周期。

Data processing method and device

The embodiment of the invention discloses a data processing method and device, the method comprises: acquiring each user in a preset period of time for the client default user behavior data, user behavior data including user access to information preset client; data slicing of user behavior data, at least two group of data units, each group of data the length of the same data unit; determining a target data unit in at least two groups of data units; according to the target data unit belongs to the user type, the client state parameter acquisition target data unit corresponding to the client; according to the state parameters corresponding to the target data unit users, determine the user's life cycle. By adopting the embodiment of the invention, the life cycle of the user can be accurately predicted.

【技术实现步骤摘要】
一种数据处理方法及装置
本专利技术涉及计算机应用
,尤其涉及一种数据处理方法及装置。
技术介绍
近年来,随着计算机网络技术的迅猛发展,互联网已经被广泛地使用。用户可以通过互联网方便、快捷地完成例如获取信息、购物、缴费、预定票务等各种日常所需,这使得用户对互联网的依赖日趋强烈。而对于网站来说,如何在第一时间了解各个用户的生命周期,以获取用户在整个生命周期对客户端的关注度,将为网站决策者在制定产品销售和宣传策略方面提供准确、及时的支持。生命周期是指用户通过互联网从与客户端建立关系开始到与客户端彻底脱离关系的整个发展过程。基于生命周期,用户可以分为4类:新用户、留存用户、回流用户以及流失用户,其中新用户为在某个时间段(一般为第一整天)新登录客户端的用户;留存用户为在某段时间内开始访问客户端,经过一段时间后仍然继续访问该客户端的用户;回流用户为暂停访问客户端,经过一段时间后重新访问该客户端的用户;流失用户为在某段时间内开始访问客户端,经过一段时间后不再访问该客户端的用户。传统的对于生命周期的确定方法为:将连续两个月访问客户端的用户确定为留存用户,将连续三个月不访问该客户端的用户确定为流失用户,将前两个月不访问但最近一个月访问该客户端的用户确定为回流用户。上述对于生命周期的确定方法未结合产品的实际运营情况,无法准确预测不同用户的生命周期。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种数据处理方法及装置,可准确预测用户的生命周期。为了解决上述技术问题,本专利技术实施例提供了一种数据处理方法,包括:获取各个用户在预设时间段内对于预设客户端的用户行为数据,所述用户行为数据包括用户对所述预设客户端的访问信息;对所述用户行为数据进行数据切片,得到至少两组数据单元,各组所述数据单元的数据长度相同;在所述至少两组数据单元中确定目标数据单元;根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数;根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期。相应地,本专利技术实施例还提供了一种数据处理装置,包括:数据获取单元,用于获取各个用户在预设时间段内对于预设客户端的用户行为数据,所述用户行为数据包括用户对所述预设客户端的访问信息;数据切片单元,用于对所述用户行为数据进行数据切片,得到至少两组数据单元,各组所述数据单元的数据长度相同;数据单元确定单元,用于在所述至少两组数据单元中确定目标数据单元;参数获取单元,用于根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数;生命周期确定单元,用于根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期。实施本专利技术实施例,获取各个用户在预设时间段内对于预设客户端的用户行为数据,对用户行为数据进行数据切片,得到至少两组数据单元,在至少两组数据单元中确定目标数据单元,根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数,根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期,相对传统的数据处理方法中直接将连续两个月访问客户端的用户确定为留存用户,将连续三个月不访问该客户端的用户确定为流失用户,将前两个月不访问但最近一个月访问该客户端的用户确定为回流用户,本专利技术实施例可准确预测用户的生命周期。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;图1是本专利技术实施例中提供的一种数据处理方法的流程示意图;图2a是本专利技术实施例中提供的一种用户行为数据的界面示意图;图2b是本专利技术实施例中提供的一种用户在不同时间周期的用户流失率的界面示意图;图3是本专利技术实施例中提供的一种数据处理装置的结构示意图;图4是本专利技术实施例中提供的一种终端的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。上述数据处理方法可以运行在平板电脑、手机或个人计算机(PersonalComputer,PC)等终端中,也可以运行在浏览器或网站等客户端中。请参见图1,图1是本专利技术实施例中的一种数据处理方法的流程示意图,如图所示本专利技术实施例中的数据处理方法可以包括:S101,获取各个用户在预设时间段内对于预设客户端的用户行为数据,用户行为数据包括用户对预设客户端的访问信息。终端可以获取各个用户在预设时间段内对于预设客户端的用户行为数据。其中,用户行为数据可以包括用户对预设客户端的访问信息,访问信息可以用于指示用户是否访问预设客户端。预设时间段可以为预先设定的时间间隔,例如连续27个时间周期,时间周期为终端记录用户行为数据的频率,例如终端每天记录一次用户对于预设客户端的用户行为数据,则时间周期为一天,预设时间段为连续27天。预设客户端可以为用户浏览的网站或者应用程序(Application,APP)等,例如腾讯游戏公会网站,或者微信、QQ等APP。示例性的,终端可以按照预设时间周期统计不同用户对预设客户端的用户行为数据,例如该时间周期内用户访问了预设客户端,则用户行为数据中的访问信息可以为1;该时间周期内用户未访问预设客户端,则用户行为数据中的访问信息可以为0。用户行为数据中的第x个元素用于指示用户在第x个时间周期是否访问预设客户端,x为正整数。当预设时间段为27个时间周期时,终端获取到的每个用户对预设客户端的用户行为数据可以包括27个元素,例如用户行为数据为11010011…10,用户行为数据中的第一个元素为1,终端可以确定用户在第一个时间周期访问了预设客户端,用户行为数据中的第27个元素为0,终端可以确定用户在第27个时间周期未访问预设客户端。S102,对用户行为数据进行数据切片,得到至少两组数据单元,各组数据单元的数据长度相同。终端可以针对每个用户对于预设客户端的用户行为数据,对用户行为数据进行数据切片,得到至少两组数据单元,各组数据单元的数据长度相同。例如,如果用户行为数据的数据长度为L,预设的数据单元的数据长度为a,终端可以对该用户行为数据进行数据切片得到L-a+1组数据单元。在可选实施例中,终端可以获取用户行为数据的数据长度L,以及预设的数据单元的数据长度a,将用户行为数据中的第一个元素确定为数据单元的起始位置,从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元,对起始位置进行更新,其中更新后的起始位置与当前起始位置之间间隔n个元素,执行从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元。其中,L、a均为正整数,n为自然数,L>a。例如,当n=0时,终端将用户行为数据中的第一个元素确定为数据单元的起始位置,从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元,将起始位置更新为当前起始位置的下一个元素,执行从起始位置开始对本文档来自技高网...
一种数据处理方法及装置

【技术保护点】
一种数据处理方法,其特征在于,包括:获取各个用户在预设时间段内对于预设客户端的用户行为数据,所述用户行为数据包括用户对所述预设客户端的访问信息;对所述用户行为数据进行数据切片,得到至少两组数据单元,各组所述数据单元的数据长度相同;在所述至少两组数据单元中确定目标数据单元;根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数;根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取各个用户在预设时间段内对于预设客户端的用户行为数据,所述用户行为数据包括用户对所述预设客户端的访问信息;对所述用户行为数据进行数据切片,得到至少两组数据单元,各组所述数据单元的数据长度相同;在所述至少两组数据单元中确定目标数据单元;根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数;根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期。2.根据权利要求1所述方法,其特征在于,所述对所述用户行为数据进行数据切片,得到至少两组数据单元,包括:获取所述用户行为数据的数据长度L,以及预设的数据单元的数据长度a;将所述用户行为数据中的第一个元素确定为数据单元的起始位置;从所述起始位置开始对所述用户行为数据进行数据切分,得到数据长度为a的数据单元;对所述起始位置进行更新,其中更新后的起始位置与当前起始位置之间间隔n个元素;执行从所述起始位置开始对所述用户行为数据进行数据切分,得到数据长度为a的数据单元。3.根据权利要求1所述方法,其特征在于,所述客户端状态参数包括用户流失率、用户留存率或者用户回流率。4.根据权利要求1所述方法,其特征在于,所述数据单元的数据长度为a;当所述客户端状态参数为用户流失率时,所述目标数据单元中第a个元素的访问信息用于指示用户未访问所述预设客户端;或者所述目标数据单元中第a个元素的访问信息用于指示用户未访问所述预设客户端,且所述目标数据单元中第a-1个元素的访问信息用于指示用户访问所述预设客户端;或者所述目标数据单元中第a个及第a-1个元素的访问信息用于指示用户未访问所述预设客户端,且所述目标数据单元中第a-2个元素的访问信息用于指示用户访问所述预设客户端;当所述客户端状态参数为用户留存率时,所述目标数据单元中第a个元素的访问信息用于指示用户访问所述预设客户端;或者所述目标数据单元中第a个及第a-1个元素的访问信息用于指示用户访问所述预设客户端;或者所述目标数据单元中第a~a-2个元素的访问信息用于指示用户访问所述预设客户端;当所述客户端状态参数为用户回流率时,所述目标数据单元中第a个元素的访问信息用于指示用户访问所述预设客户端,且所述目标数据单元中第a-1个元素的访问信息用于指示用户未访问所述预设客户端;或者所述目标数据单元中第a个元素的访问信息用于指示用户访问所述预设客户端,且所述目标数据单元中第a-1个及第a-2个元素的访问信息用于指示用户未访问所述预设客户端;或者所述目标数据单元中第a个元素的访问信息用于指示用户访问所述预设客户端,且所述目标数据单元中第a-1~a-3个元素的访问信息用于指示用户未访问所述预设客户端。5.根据权利要求1所述方法,其特征在于,所述在所述至少两组数据单元中确定目标数据单元,包括:在每组数据单元中,依次将每两个元素作为一个子数据;当所述两个元素中任意一个元素的访问信息用于指示用户访问所述预设客户端时,确定所述两个元素对应的子数据的访问信息用于指示用户访问所述预设客户端;当所述两个元素的访问信息均用于指示用户未访问所述预设客户端时,确定所述两个元素对应的子数据的访问信息用于指示用户未访问所述预设客户端;将依次确定得到的子数据作为更新后的数据单元;在所述更新后的数据单元中确定目标数据单元。6.根据权利要求1所述方法,其特征在于,所述根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数,包括:当所述客户端状态参数为用户流失率时,根据所述目标数据单元所属用户的用户类型,获取流失用户量以及非流失用户量,所述用户类型包括流失用户或者非流失用户;将所述流失用户量与所述非流失用户量进行相加,得到所述目标数据单元所属用户的访问用户量;将所述流失用户量除以所述访问用户量,得到所述目标数据单元对应的用户流失率;当所述客户端状态参数为用户留存率时,根据所述目标数据单元所属用户的用户类型,获取留存用户量以及非留存用户量,所述用户类型包括留存用户或者非留存用户;将所述留存用户量与所述非留存用户量进行相加,得到所述目标数据单元所属用户的访问用户量;将所述留存用户量除以所述访问用户量,得到所述目标数据单元对应的用户留存率;当所述客户端状态参数为用户回流率时,根据所述目标数据单元所属用户的用户类型,获取回流用户量以及非回流用户量,所述用户类型包括回流用户或者非回流用户;将所述回流用户量与所述非回流用户量进行相加,得到所述目标数据单元所属用户的访问用户量;将所述回流用户量除以所述访问用户量,得到所述目标数据单元对应的用户回流率。7.根据权利要求1所述方法,其特征在于,所述根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期,包括:获取满足不同条件下的用户的目标数据单元对应的用户流失率,将所述满足不同条件下的用户的目标数据单元对应的用户流失率作为预设流失率确定算法的输入,得到所述用户的用户流失率;或者获取满足不同条件下的用户的目标数据单元对应的用户留存率,将所述满足不同条件下的用户的目标数据单元对应的用户留存率作为预设留存率确定算法的输入,得到所述用户的用户留存率;或者获取满足不同条件下的用户的目标数据单元对应的用户回流率,将所述满足不同条件下的用户的目标...

【专利技术属性】
技术研发人员:彭飞
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1