The application relates to the field of computer technology, in particular to a target user identification method and device, in which a sample data set is collected. According to the behavior data, determine the deviation degree of users' behavior. According to the default business activity cycle, multiple behavioral data are divided into multiple behavioral data groups. Grouping each behavior data, the active days of users in the preset business active cycle are counted, and the active frequency of users is obtained according to the active days and the preset business active cycle. According to the number of active frequencies obtained, the user's behavioral attenuation and long-term activity are determined. According to the behavior attenuation, long-term activity, behavior deviation and preset algorithm, the user's score is obtained. When the score satisfies the presupposed condition, the user is identified as the target user. Thus, the timeliness and accuracy of target user identification can be improved.
【技术实现步骤摘要】
目标用户的识别方法及装置
本申请涉及计算机
,尤其涉及一种目标用户的识别方法及装置。
技术介绍
传统技术中,通常只基于某一行为特征数据来识别目标用户。如,在识别流失用户时,若某用户在动态X天内不再活跃,则将该用户识别为流失用户。然而,该方法具有严重的滞后性,也即在用户已经为目标用户的情况下,才能将该用户识别为目标用户,这种识别是没有意义的。此外,上述仅仅根据某一行为特征数据来识别目标用户往往不够准确。如,上述根据在动态X天内是否活跃来识别流失用户时,因为许多用户天然的活跃频次和周期就偏低和长,因此,上述在判断用户在动态X天内不再活跃,就将该用户识别为流失用户是不准确的。
技术实现思路
本申请描述了一种目标用户的识别方法及装置,可以提高目标用户识别的及时性和准确性。第一方面,提供了一种目标用户的识别方法,包括:搜集样本数据集合,所述样本数据集合包括用户的行为数据;根据所述行为数据,确定所述用户的行为偏离度;根据预设的业务活跃周期,将所述多个行为数据划分为多个行为数据分组;对每个行为数据分组,统计所述用户在所述预设的业务活跃周期内的活跃天数,并根据所述活跃天数以及所述预设的业务活跃周期,获得所述用户的活跃频次;根据获得的多个活跃频次,确定所述用户的行为衰减度以及长期活跃度;根据所述行为衰减度、所述长期活跃度、所述行为偏离度以及预设算法,获得所述用户的分数值;当所述分数值满足预设条件时,将所述用户识别为目标用户。第二方面,提供了一种目标用户的识别装置,包括:搜集单元,用于搜集样本数据集合,所述样本数据集合包括用户的行为数据;确定单元,用于根据所述搜集单元搜集的 ...
【技术保护点】
1.一种目标用户的识别方法,其特征在于,包括:搜集样本数据集合,所述样本数据集合包括用户的行为数据;根据所述行为数据,确定所述用户的行为偏离度;根据预设的业务活跃周期,将所述多个行为数据划分为多个行为数据分组;对每个行为数据分组,统计所述用户在所述预设的业务活跃周期内的活跃天数,并根据所述活跃天数以及所述预设的业务活跃周期,获得所述用户的活跃频次;根据获得的多个活跃频次,确定所述用户的行为衰减度以及长期活跃度;根据所述行为衰减度、所述长期活跃度、所述行为偏离度以及预设算法,获得所述用户的分数值;当所述分数值满足预设条件时,将所述用户识别为目标用户。
【技术特征摘要】
1.一种目标用户的识别方法,其特征在于,包括:搜集样本数据集合,所述样本数据集合包括用户的行为数据;根据所述行为数据,确定所述用户的行为偏离度;根据预设的业务活跃周期,将所述多个行为数据划分为多个行为数据分组;对每个行为数据分组,统计所述用户在所述预设的业务活跃周期内的活跃天数,并根据所述活跃天数以及所述预设的业务活跃周期,获得所述用户的活跃频次;根据获得的多个活跃频次,确定所述用户的行为衰减度以及长期活跃度;根据所述行为衰减度、所述长期活跃度、所述行为偏离度以及预设算法,获得所述用户的分数值;当所述分数值满足预设条件时,将所述用户识别为目标用户。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述预设的业务活跃周期的步骤,包括:根据所述行为数据,确定所述用户的相邻两次行为的时间间隔;搜集其它用户的其它行为数据,所述其它行为数据与所述行为数据属于同类行为数据;根据所述其它行为数据,确定所述其它用户的相邻两次行为的时间间隔;根据在预设时间段内,所述用户的相邻两次行为的时间间隔以及所述其它用户的相邻两次行为的时间间隔,确定所述预设的业务活跃周期。3.根据权利要求1或2所述的方法,其特征在于,所述根据获得的多个活跃频次,确定所述用户的行为衰减度,包括:根据所述多个活跃频次,获取表征所述用户的行为变化趋势的信息;根据所述表征所述用户的行为变化趋势的信息,确定所述用户的行为衰减度。4.根据权利要求3所述的方法,其特征在于,所述根据所述多个活跃频次,获取表征所述用户的行为变化趋势的信息,包括:按照预设阈值,将所述多个活跃频次划分为多个活跃频次分组;计算各个活跃频次分组的活跃频次平均值,得到多个活跃频次平均值;从所述多个活跃频次平均值中选取最大平均值以及当前日期所对应的活跃频次分组的当前平均值;根据所述最大平均值、所述最大平均值对应的日期、当前平均值以及当前日期,获取所述表征所述用户的行为变化趋势的信息。5.根据权利要求1或2所述的方法,其特征在于,所述根据所述行为数据,确定所述用户的行为偏离度,包括:将所述行为数据划分为近期行为数据和远期行为数据;根据所述远期行为数据,确定所述用户的相邻两次远期行为的时间间隔;根据所述近期行为数据,确定所述用户的相邻两次近期行为的时间间隔;根据相邻两次远期行为的时间间隔以及相邻两次近期行为的时间间隔,确定所述用户的行为偏离度。6.根据权利要求5所述的方法,其特征在于,所述根据相邻两次远期行为的时间间隔以及相邻两次近期行为的时间间隔,确定所述用户的行为偏离度,包括:根据相邻两次远期行为的时间间隔,在一维空间中确定质点;计算相邻两次近期行为的时间间隔与所述质点的欧几里德距离;将所述欧几里德距离作为所述用户的行为偏离度。7.根据权利要求1所述的方法,其特征在于,所述用户的行为数据为预设天数内的行为数据;所述根据获得的多个活跃频次,确定所述用户的长期活跃度,包括:根据所述预设天数以及所述预设的业务活跃周期,确定所述行为数据分组的个数;根据所述多个活跃频次以及所述行为数据分组的个数,确定所述用户的长期活跃度。8.根据权利要求1-7任一项所述的方法,其特征在于,所述目标用户为流失用户。9.一...
【专利技术属性】
技术研发人员:孔健,杨建形,薛巍,徐靖,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。