The embodiment of the invention discloses a data processing method and device, the method comprises: acquiring each user in a preset period of time for the client default user behavior data, user behavior data including user access to information preset client; data slicing of user behavior data, at least two group of data units, each group of data the length of the same data unit; determining a target data unit in at least two groups of data units; according to the target data unit belongs to the user type, the client state parameter acquisition target data unit corresponding to the client; according to the state parameters corresponding to the target data unit users, determine the user's life cycle. By adopting the embodiment of the invention, the life cycle of the user can be accurately predicted.
【技术实现步骤摘要】
一种数据处理方法及装置
本专利技术涉及计算机应用
,尤其涉及一种数据处理方法及装置。
技术介绍
近年来,随着计算机网络技术的迅猛发展,互联网已经被广泛地使用。用户可以通过互联网方便、快捷地完成例如获取信息、购物、缴费、预定票务等各种日常所需,这使得用户对互联网的依赖日趋强烈。而对于网站来说,如何在第一时间了解各个用户的生命周期,以获取用户在整个生命周期对客户端的关注度,将为网站决策者在制定产品销售和宣传策略方面提供准确、及时的支持。生命周期是指用户通过互联网从与客户端建立关系开始到与客户端彻底脱离关系的整个发展过程。基于生命周期,用户可以分为4类:新用户、留存用户、回流用户以及流失用户,其中新用户为在某个时间段(一般为第一整天)新登录客户端的用户;留存用户为在某段时间内开始访问客户端,经过一段时间后仍然继续访问该客户端的用户;回流用户为暂停访问客户端,经过一段时间后重新访问该客户端的用户;流失用户为在某段时间内开始访问客户端,经过一段时间后不再访问该客户端的用户。传统的对于生命周期的确定方法为:将连续两个月访问客户端的用户确定为留存用户,将连续三个月不访问该客户端的用户确定为流失用户,将前两个月不访问但最近一个月访问该客户端的用户确定为回流用户。上述对于生命周期的确定方法未结合产品的实际运营情况,无法准确预测不同用户的生命周期。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种数据处理方法及装置,可准确预测用户的生命周期。为了解决上述技术问题,本专利技术实施例提供了一种数据处理方法,包括:获取各个用户在预设时间段内对于预设客户端的用户行为数 ...
【技术保护点】
一种数据处理方法,其特征在于,包括:获取各个用户在预设时间段内对于预设客户端的用户行为数据,所述用户行为数据包括用户对所述预设客户端的访问信息;对所述用户行为数据进行数据切片,得到至少两组数据单元,各组所述数据单元的数据长度相同;在所述至少两组数据单元中确定目标数据单元;根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数;根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期。
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取各个用户在预设时间段内对于预设客户端的用户行为数据,所述用户行为数据包括用户对所述预设客户端的访问信息;对所述用户行为数据进行数据切片,得到至少两组数据单元,各组所述数据单元的数据长度相同;在所述至少两组数据单元中确定目标数据单元;根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数;根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期。2.根据权利要求1所述方法,其特征在于,所述对所述用户行为数据进行数据切片,得到至少两组数据单元,包括:获取所述用户行为数据的数据长度L,以及预设的数据单元的数据长度a;将所述用户行为数据中的第一个元素确定为数据单元的起始位置;从所述起始位置开始对所述用户行为数据进行数据切分,得到数据长度为a的数据单元;对所述起始位置进行更新,其中更新后的起始位置与当前起始位置之间间隔n个元素;执行从所述起始位置开始对所述用户行为数据进行数据切分,得到数据长度为a的数据单元。3.根据权利要求1所述方法,其特征在于,所述客户端状态参数包括用户流失率、用户留存率或者用户回流率。4.根据权利要求1所述方法,其特征在于,所述数据单元的数据长度为a;当所述客户端状态参数为用户流失率时,所述目标数据单元中第a个元素的访问信息用于指示用户未访问所述预设客户端;或者所述目标数据单元中第a个元素的访问信息用于指示用户未访问所述预设客户端,且所述目标数据单元中第a-1个元素的访问信息用于指示用户访问所述预设客户端;或者所述目标数据单元中第a个及第a-1个元素的访问信息用于指示用户未访问所述预设客户端,且所述目标数据单元中第a-2个元素的访问信息用于指示用户访问所述预设客户端;当所述客户端状态参数为用户留存率时,所述目标数据单元中第a个元素的访问信息用于指示用户访问所述预设客户端;或者所述目标数据单元中第a个及第a-1个元素的访问信息用于指示用户访问所述预设客户端;或者所述目标数据单元中第a~a-2个元素的访问信息用于指示用户访问所述预设客户端;当所述客户端状态参数为用户回流率时,所述目标数据单元中第a个元素的访问信息用于指示用户访问所述预设客户端,且所述目标数据单元中第a-1个元素的访问信息用于指示用户未访问所述预设客户端;或者所述目标数据单元中第a个元素的访问信息用于指示用户访问所述预设客户端,且所述目标数据单元中第a-1个及第a-2个元素的访问信息用于指示用户未访问所述预设客户端;或者所述目标数据单元中第a个元素的访问信息用于指示用户访问所述预设客户端,且所述目标数据单元中第a-1~a-3个元素的访问信息用于指示用户未访问所述预设客户端。5.根据权利要求1所述方法,其特征在于,所述在所述至少两组数据单元中确定目标数据单元,包括:在每组数据单元中,依次将每两个元素作为一个子数据;当所述两个元素中任意一个元素的访问信息用于指示用户访问所述预设客户端时,确定所述两个元素对应的子数据的访问信息用于指示用户访问所述预设客户端;当所述两个元素的访问信息均用于指示用户未访问所述预设客户端时,确定所述两个元素对应的子数据的访问信息用于指示用户未访问所述预设客户端;将依次确定得到的子数据作为更新后的数据单元;在所述更新后的数据单元中确定目标数据单元。6.根据权利要求1所述方法,其特征在于,所述根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数,包括:当所述客户端状态参数为用户流失率时,根据所述目标数据单元所属用户的用户类型,获取流失用户量以及非流失用户量,所述用户类型包括流失用户或者非流失用户;将所述流失用户量与所述非流失用户量进行相加,得到所述目标数据单元所属用户的访问用户量;将所述流失用户量除以所述访问用户量,得到所述目标数据单元对应的用户流失率;当所述客户端状态参数为用户留存率时,根据所述目标数据单元所属用户的用户类型,获取留存用户量以及非留存用户量,所述用户类型包括留存用户或者非留存用户;将所述留存用户量与所述非留存用户量进行相加,得到所述目标数据单元所属用户的访问用户量;将所述留存用户量除以所述访问用户量,得到所述目标数据单元对应的用户留存率;当所述客户端状态参数为用户回流率时,根据所述目标数据单元所属用户的用户类型,获取回流用户量以及非回流用户量,所述用户类型包括回流用户或者非回流用户;将所述回流用户量与所述非回流用户量进行相加,得到所述目标数据单元所属用户的访问用户量;将所述回流用户量除以所述访问用户量,得到所述目标数据单元对应的用户回流率。7.根据权利要求1所述方法,其特征在于,所述根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期,包括:获取满足不同条件下的用户的目标数据单元对应的用户流失率,将所述满足不同条件下的用户的目标数据单元对应的用户流失率作为预设流失率确定算法的输入,得到所述用户的用户流失率;或者获取满足不同条件下的用户的目标数据单元对应的用户留存率,将所述满足不同条件下的用户的目标数据单元对应的用户留存率作为预设留存率确定算法的输入,得到所述用户的用户留存率;或者获取满足不同条件下的用户的目标数据单元对应的用户回流率,将所述满足不同条件下的用户的目标...
【专利技术属性】
技术研发人员:彭飞,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。