【技术实现步骤摘要】
一种去除周期性因素流失用户的预测方法及系统
本专利技术涉及数据库
,特别是涉及一种去除周期性因素流失用户的预测方法及系统。
技术介绍
随着智能化校园,智能化企业,智能化家居的迅速发展,许多新型的互联网产品不断涌现,对于一款互联网产品来说,往往不可避免的会面临用户流失的问题。一定范围内的用户流失率是可以被接受的,因为通过各种渠道接触到产品的用户并不一定都是我们的目标用户。但当流失率高于我们的预期值,我们就需要分析用户离开的原因,制定相应的措施挽回已经流失的用户。因此如何准确的预测流失用户就显得极其重要。预测流失用户的关键在于确定合适的流失期限,传统通常采用经验法,经验性的制定一个流失期限,或者根据访问行为后台数据找出流失期限与回访率的相关曲线拐点,但是未考虑到一些产品的访问包含一定的周期性。例如饿了么、美团外卖等互联网产品需要考虑到学生这类用户具有寒暑假,在假期期间,用户几乎没有访问行为即用户非主观不使用软件,这部分数据将会影响最终流失期限的计算。因此需要一种方法和系统,能结合每个用户的周期性因素,判断用户访问间隔(本次访问及下次访问之间的时间间隔)是否包含周 ...
【技术保护点】
1.一种去除周期性因素流失用户的预测方法,其特征在于,包括如下步骤:步骤一:整理用户所有关键行为表数据;所述关键行为表数据包括日期维表DIM_C和用户维表DIM_USER,所述日期维表DIM_C包含从产品发布日期至今的所有日期;所述用户维表DIM_USER包含从产品发布日期至今的所有用户的添加时间、年龄、性别、地址、联系方式等数据信息;步骤二:对用户访问间隔及末次访问时间(cal_last_visit)进行计算,对用户所有关键行为表数据中的访问时间进行排序,将用户所有关键行为表数据中的访问时间选取出来,并将访问时间排序,增加一个排序标签ro,以用户id(user_id),访 ...
【技术特征摘要】
1.一种去除周期性因素流失用户的预测方法,其特征在于,包括如下步骤:步骤一:整理用户所有关键行为表数据;所述关键行为表数据包括日期维表DIM_C和用户维表DIM_USER,所述日期维表DIM_C包含从产品发布日期至今的所有日期;所述用户维表DIM_USER包含从产品发布日期至今的所有用户的添加时间、年龄、性别、地址、联系方式等数据信息;步骤二:对用户访问间隔及末次访问时间(cal_last_visit)进行计算,对用户所有关键行为表数据中的访问时间进行排序,将用户所有关键行为表数据中的访问时间选取出来,并将访问时间排序,增加一个排序标签ro,以用户id(user_id),访问时间(cal_visit),ro字段存储在表1,表1与自身按user_id=user_id和ro+1=ro关联,找出每次访问后的下次访问时间及访问时间间隔,以用户id(user_id),访问时间(cal_number),下次访问时间(cal_number_next),访问间隔(return_visit_days)字段存入一张新表A;表A与自身按user_id=user_id关联,限制第一张表A的访问间隔(return_visit_days)不为空,第二张访问间隔(return_visit_days)为空,取出第二张表的访问时间(cal_number)即用户的末次访问时间(cal_last_visit),最后以用户id(user_id),访问时间(cal_number),下次访问时间(cal_number_next),访问间隔(return_visit_days),末次访问时间(cal_last_visit)存入表B;步骤三:分析用户的周期性,找出用户具有周期性非主观不使用产品的时间段;将用户id(user_id)、非主观不使用开始时间(nouse_cal_start)、非主观不使用结束时间(nouse_cal_end)、非主观不使用时间间隔(nouse_days)存储在新表C;表B及表C通过user_id=user_id,cal_number≤nouser_cal_start,cal_number_next≥nouse_cal_end关联,取出C表字段非主观不使用时间间隔(nouse_days)并运用聚合函数sum(b.nouse_days)over(partitionbya.user_id,a.cal_number,a.cal_number_next)计算出每次访问间隔(return_visit_days)中非主观不使用天数,访问间隔(return_visit_days)减去非主观不使用天数,从而计算出实际访问间隔(return_visit_days_real),以user_id,cal_number,cal_number_next,cal_last_vist,return_visit_days_real存入表D。步骤四:使用拐点法计算流失期限;首先定义一段固定时长为流失期限(lost_period),用户访问后若超过流失期限没再访问,所述流失期限去除非主观不使用天数,则为流失用户,若用户回访,则为流失用户中的回访用户,即回访率=流失用户中的回访用户/流失用户;从表D中取出每个用户的访问天数,如果用户仅访问过一次,则判断访问时间距离当前时间是否已超过流失...
【专利技术属性】
技术研发人员:李娟,房鹏展,
申请(专利权)人:焦点科技股份有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。