目标用户的识别方法及装置制造方法及图纸

技术编号:18896145 阅读:30 留言:0更新日期:2018-09-08 11:44
本申请涉及计算机技术领域,尤其涉及一种目标用户的识别方法及装置,在一种目标用户的识别方法中,搜集样本数据集合。根据行为数据,确定用户的行为偏离度。根据预设的业务活跃周期,将多个行为数据划分为多个行为数据分组。对每个行为数据分组,统计用户在预设的业务活跃周期内的活跃天数,并根据活跃天数以及预设的业务活跃周期,获得用户的活跃频次。根据获得的多个活跃频次,确定用户的行为衰减度以及长期活跃度。根据行为衰减度、长期活跃度、行为偏离度以及预设算法,获得用户的分数值。当分数值满足预设条件时,将用户识别为目标用户。由此,可以提高目标用户识别的及时性和准确性。

Target user identification method and device

The application relates to the field of computer technology, in particular to a target user identification method and device, in which a sample data set is collected. According to the behavior data, determine the deviation degree of users' behavior. According to the default business activity cycle, multiple behavioral data are divided into multiple behavioral data groups. Grouping each behavior data, the active days of users in the preset business active cycle are counted, and the active frequency of users is obtained according to the active days and the preset business active cycle. According to the number of active frequencies obtained, the user's behavioral attenuation and long-term activity are determined. According to the behavior attenuation, long-term activity, behavior deviation and preset algorithm, the user's score is obtained. When the score satisfies the presupposed condition, the user is identified as the target user. Thus, the timeliness and accuracy of target user identification can be improved.

【技术实现步骤摘要】
目标用户的识别方法及装置
本申请涉及计算机
,尤其涉及一种目标用户的识别方法及装置。
技术介绍
传统技术中,通常只基于某一行为特征数据来识别目标用户。如,在识别流失用户时,若某用户在动态X天内不再活跃,则将该用户识别为流失用户。然而,该方法具有严重的滞后性,也即在用户已经为目标用户的情况下,才能将该用户识别为目标用户,这种识别是没有意义的。此外,上述仅仅根据某一行为特征数据来识别目标用户往往不够准确。如,上述根据在动态X天内是否活跃来识别流失用户时,因为许多用户天然的活跃频次和周期就偏低和长,因此,上述在判断用户在动态X天内不再活跃,就将该用户识别为流失用户是不准确的。
技术实现思路
本申请描述了一种目标用户的识别方法及装置,可以提高目标用户识别的及时性和准确性。第一方面,提供了一种目标用户的识别方法,包括:搜集样本数据集合,所述样本数据集合包括用户的行为数据;根据所述行为数据,确定所述用户的行为偏离度;根据预设的业务活跃周期,将所述多个行为数据划分为多个行为数据分组;对每个行为数据分组,统计所述用户在所述预设的业务活跃周期内的活跃天数,并根据所述活跃天数以及所述预设的业务活跃周期,获得所述用户的活跃频次;根据获得的多个活跃频次,确定所述用户的行为衰减度以及长期活跃度;根据所述行为衰减度、所述长期活跃度、所述行为偏离度以及预设算法,获得所述用户的分数值;当所述分数值满足预设条件时,将所述用户识别为目标用户。第二方面,提供了一种目标用户的识别装置,包括:搜集单元,用于搜集样本数据集合,所述样本数据集合包括用户的行为数据;确定单元,用于根据所述搜集单元搜集的所述行为数据,确定所述用户的行为偏离度;划分单元,用于根据预设的业务活跃周期,将所述多个行为数据划分为多个行为数据分组;统计单元,用于对所述划分单元划分的每个行为数据分组,统计所述用户在所述预设的业务活跃周期内的活跃天数,并根据所述活跃天数以及所述预设的业务活跃周期,获得所述用户的活跃频次;所述确定单元,还用于根据获得的多个活跃频次,确定所述用户的行为衰减度以及长期活跃度;获取单元,用于根据所述确定单元确定的所述行为衰减度、所述长期活跃度、所述行为偏离度以及预设算法,获得所述用户的分数值;识别单元,用于当所述获取单元获得的所述分数值满足预设条件时,将所述用户识别为目标用户。本申请提供的目标用户的识别方法及装置,搜集样本数据集合。根据行为数据,确定用户的行为偏离度。根据预设的业务活跃周期,将多个行为数据划分为多个行为数据分组。对每个行为数据分组,统计用户在预设的业务活跃周期内的活跃天数,并根据活跃天数以及预设的业务活跃周期,获得用户的活跃频次。根据获得的多个活跃频次,确定用户的行为衰减度以及长期活跃度。根据行为衰减度、长期活跃度、行为偏离度以及预设算法,获得用户的分数值。当分数值满足预设条件时,将用户识别为目标用户。由此,可以提高目标用户识别的及时性和准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本申请一种实施例提供的目标用户的识别方法流程图;图2为本申请提供的确定用户的行为偏离度的方法流程图;图3为本申请提供的用户的行为偏离度的示意图;图4为本申请提供的获取表征用户的行为变化趋势的信息的方法流程图;图5为本申请提供的用户的分数值的获取方法示意图;图6为本申请一种实施例提供的目标用户的识别装置示意图。具体实施方式下面结合附图,对本申请的实施例进行描述。本申请实施例提供的目标用户的识别方法及装置适用于对目标用户进行识别的场景。如,适用于对支付宝系统中的流失用户进行识别的场景。其中,流失用户包括即将流失的用户和已经流失的用户两种类型。图1为本申请一种实施例提供的目标用户的识别方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置,如图1所示,所述方法具体包括:步骤110,搜集样本数据集合。该样本数据集合包括用户的行为数据。在一种实现方式中,可以是针对某一类业务,来搜集用户的行为数据。当针对某一类业务,来搜集用户的行为数据时,用户的行为数据通常为一类的行为数据。如,均为登录行为数据或者支付行为数据。以用户的登录行为数据为例来说,可以从分布式的海量数据处理平台(OpenDataProcessingService,ODPS)中搜集用户的登录行为数据,且搜集的登录行为数据可以为:××用户于2017年1月20日登录××APP;××用户于2017年1月23日登录××APP等等。在一种实现方式中,可以搜集预设天数内的用户的行为数据。如,可以搜集30天内用户的登录行为数据。此处的预设天数可以根据经验值设定,如,还可以为60天或者90天等。步骤120,根据行为数据,确定用户的行为偏离度。在一种实现方式中,可以根据如图2所示的各步骤,来确定用户的行为偏离度。图2中,包括如下步骤:步骤210,将行为数据划分为近期行为数据和远期行为数据。举例来说,假设样本数据集合如表1所示。即样本数据集合中包括了用户A30天内的登录行为数据,且该登录行为数据中包括了用户的登录行为的发生时间。表1用户A于2017年1月3日登录××APP用户A于2017年1月5日登录××APP用户A于2017年1月8日登录××APP用户A于2017年1月12日登录××APP用户A于2017年1月19日登录××APP用户A于2017年1月26日登录××APP在一种实现方式中,可以将用户最近两次的行为数据作为近期行为数据,而将其它的行为数据作为远期行为数据。以表1为例来说,可以将前四行用户的行为数据划分为远期行为数据,而将后两行的行为数据划分为近期行为数据。步骤220,根据远期行为数据,确定用户的相邻两次远期行为的时间间隔。可以理解的是,当远期行为数据为多个时,确定的用户的相邻两次远期行为的时间间隔也为多个。以表1为例来说,用户的远期行为数据包括了前四行的用户的行为数据,也即用户A执行了四次远期登录行为,该四次登录行为的发生时间分别为:2017年1月3日、2017年1月5日、2017年1月8日以及2017年1月12日。从而可以确定出三个相邻两次远期行为的时间间隔,分别为:“2天”、“3天”和“4天”。步骤230,根据近期行为数据,确定用户的相邻两次近期行为的时间间隔。可以理解的是,当将用户最近两次的行为数据作为近期行为数据时,确定的相邻两次近期行为的时间间隔通常为1个。以表1为例来说,用户A的近期行为数据包括了后两行的用户的行为数据,也即用户A最近两次登录行为的发生时间分别为:2017年1月19日和2017年1月26日。从而可以确定出两个相邻两次近期行为的时间间隔为:7天。步骤240,根据相邻两次远期行为的时间间隔以及相邻两次近期行为的时间间隔,确定用户的行为偏离度。用户的近期行为和远期行为均是既定表现,而用户近期表现出来的行为往往与客观描述的值存在误差,这个误差的定量描述就是用户的行为偏离度。由于用户使用习惯的改变属于小概率事件,可以假定用户的行为偏离度符合高斯分布。在假定本文档来自技高网...

【技术保护点】
1.一种目标用户的识别方法,其特征在于,包括:搜集样本数据集合,所述样本数据集合包括用户的行为数据;根据所述行为数据,确定所述用户的行为偏离度;根据预设的业务活跃周期,将所述多个行为数据划分为多个行为数据分组;对每个行为数据分组,统计所述用户在所述预设的业务活跃周期内的活跃天数,并根据所述活跃天数以及所述预设的业务活跃周期,获得所述用户的活跃频次;根据获得的多个活跃频次,确定所述用户的行为衰减度以及长期活跃度;根据所述行为衰减度、所述长期活跃度、所述行为偏离度以及预设算法,获得所述用户的分数值;当所述分数值满足预设条件时,将所述用户识别为目标用户。

【技术特征摘要】
1.一种目标用户的识别方法,其特征在于,包括:搜集样本数据集合,所述样本数据集合包括用户的行为数据;根据所述行为数据,确定所述用户的行为偏离度;根据预设的业务活跃周期,将所述多个行为数据划分为多个行为数据分组;对每个行为数据分组,统计所述用户在所述预设的业务活跃周期内的活跃天数,并根据所述活跃天数以及所述预设的业务活跃周期,获得所述用户的活跃频次;根据获得的多个活跃频次,确定所述用户的行为衰减度以及长期活跃度;根据所述行为衰减度、所述长期活跃度、所述行为偏离度以及预设算法,获得所述用户的分数值;当所述分数值满足预设条件时,将所述用户识别为目标用户。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述预设的业务活跃周期的步骤,包括:根据所述行为数据,确定所述用户的相邻两次行为的时间间隔;搜集其它用户的其它行为数据,所述其它行为数据与所述行为数据属于同类行为数据;根据所述其它行为数据,确定所述其它用户的相邻两次行为的时间间隔;根据在预设时间段内,所述用户的相邻两次行为的时间间隔以及所述其它用户的相邻两次行为的时间间隔,确定所述预设的业务活跃周期。3.根据权利要求1或2所述的方法,其特征在于,所述根据获得的多个活跃频次,确定所述用户的行为衰减度,包括:根据所述多个活跃频次,获取表征所述用户的行为变化趋势的信息;根据所述表征所述用户的行为变化趋势的信息,确定所述用户的行为衰减度。4.根据权利要求3所述的方法,其特征在于,所述根据所述多个活跃频次,获取表征所述用户的行为变化趋势的信息,包括:按照预设阈值,将所述多个活跃频次划分为多个活跃频次分组;计算各个活跃频次分组的活跃频次平均值,得到多个活跃频次平均值;从所述多个活跃频次平均值中选取最大平均值以及当前日期所对应的活跃频次分组的当前平均值;根据所述最大平均值、所述最大平均值对应的日期、当前平均值以及当前日期,获取所述表征所述用户的行为变化趋势的信息。5.根据权利要求1或2所述的方法,其特征在于,所述根据所述行为数据,确定所述用户的行为偏离度,包括:将所述行为数据划分为近期行为数据和远期行为数据;根据所述远期行为数据,确定所述用户的相邻两次远期行为的时间间隔;根据所述近期行为数据,确定所述用户的相邻两次近期行为的时间间隔;根据相邻两次远期行为的时间间隔以及相邻两次近期行为的时间间隔,确定所述用户的行为偏离度。6.根据权利要求5所述的方法,其特征在于,所述根据相邻两次远期行为的时间间隔以及相邻两次近期行为的时间间隔,确定所述用户的行为偏离度,包括:根据相邻两次远期行为的时间间隔,在一维空间中确定质点;计算相邻两次近期行为的时间间隔与所述质点的欧几里德距离;将所述欧几里德距离作为所述用户的行为偏离度。7.根据权利要求1所述的方法,其特征在于,所述用户的行为数据为预设天数内的行为数据;所述根据获得的多个活跃频次,确定所述用户的长期活跃度,包括:根据所述预设天数以及所述预设的业务活跃周期,确定所述行为数据分组的个数;根据所述多个活跃频次以及所述行为数据分组的个数,确定所述用户的长期活跃度。8.根据权利要求1-7任一项所述的方法,其特征在于,所述目标用户为流失用户。9.一...

【专利技术属性】
技术研发人员:孔健杨建形薛巍徐靖
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1