一种潜在用户的识别方法和装置制造方法及图纸

技术编号:30518518 阅读:33 留言:0更新日期:2021-10-27 23:01
本发明专利技术公开了一种潜在用户的识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:基于第一产品池构造用户样本集;利用用户样本集中的用户在第一产品池之外的行为数据,确定与第一产品池相关的第二产品池;获取用户样本集的用户数据,用户样本集的用户数据包括用户样本集中用户对第一产品池和第二产品池的行为数据,基于用户样本集的用户数据提取用户样本集的用户多维特征;通过用户样本集的用户多维特征训练分类模型;利用分类模型,根据待分类的用户数据,识别第一产品池的潜在用户。该实施方式能够预测出在目标商品池无下单、浏览及加购等行为的潜在用户,增加了时间季节性特征等用户多维特征,提高了预测潜在用户的准确性。测潜在用户的准确性。测潜在用户的准确性。

【技术实现步骤摘要】
一种潜在用户的识别方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种潜在用户的识别方法和装置。

技术介绍

[0002]电商领域中,目前潜在用户的识别预测方案主要有两种:方案一为统计用户近期在目标产品池的下单、浏览、加购等行为,将统计的行为按一定权重比例计算分数,根据分数排序作为判定潜在用户的依据;方案二为将用户在目标产品池的下单、浏览、加购等行为数据作为特征,训练机器学习模型,并预测潜在用户。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0004]方案一因权重参数难以调整而导致无法保证预测的准确性;方案二难以预测出在目标商品池无下单、浏览及加购等行为的潜在用户,且没有考虑时间季节性特征对于用户的影响,预测准确性低。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供一种潜在用户的识别方法和装置,能够预测出在目标商品池无下单、浏览及加购等行为的潜在用户,增加了时间季节性特征等用户多维特征,提高了预测潜在用户的准确性。
[0006]为实现上述目的,根本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种潜在用户的识别方法,其特征在于,包括:基于第一产品池构造用户样本集;利用所述用户样本集中的用户在所述第一产品池之外的行为数据,确定与所述第一产品池相关的第二产品池;获取所述用户样本集的用户数据,所述用户样本集的用户数据包括所述用户样本集中用户对所述第一产品池和所述第二产品池的行为数据,基于所述用户样本集的用户数据提取所述用户样本集的用户多维特征;通过所述用户样本集的用户多维特征训练分类模型;利用所述分类模型,根据待分类的用户数据,识别所述第一产品池的潜在用户。2.根据权利要求1所述的方法,其特征在于,所述基于第一产品池构造用户样本集,包括:将设定时间窗口内对所述第一产品池中任一产品有购买行为的用户作为正样本,将所述设定时间窗口内对所述第一产品池中任一产品均没有购买行为的用户作为负样本,根据作为所述正样本、所述负样本的各用户,得到所述用户样本集。3.根据权利要求2所述的方法,其特征在于,所述利用所述用户样本集中的用户在所述第一产品池之外的行为数据,确定与所述第一产品池相关的第二产品池,包括:遍历除所述第一产品池中的品类之外的所有品类,利用所述用户样本集中的用户在所遍历到的品类的行为数据,通过假设检验的方式来检验所述用户样本集中作为所述正样本、所述负样本的用户的行为数据的显著差异,以判断所遍历到的品类与所述第一产品池中品类的相关性,根据与所述第一产品池中品类相关的品类,确定所述第二产品池。4.根据权利要求3所述的方法,其特征在于,按照品类级别维度,遍历除所述第一产品池中的品类之外的所有产品品类;所述通过假设检验的方式来检验所述用户样本集中作为所述正样本、所述负样本的用户的行为数据的显著差异,以判断所遍历到的品类与所述第一产品池中品类的相关性,包括:对于遍历到的当前级别的一个目标品类,使用秩和检验,判断所述正样本在所述目标品类的订单量均值与所述负样本在所述目标品类的订单量均值是否相等,若不等,则所述目标品类为与所述第一产品池中品类相关的品类。5.根据权利要求1所述的方法,其特征在于,所述用户样本集的用户多维特征包括所述用户样本集中用户的与品类相关的行为特征;所述提取所述用户样本集的用户多维特征,包括:分别从产品粒度维度、用户行为维度、用户行为统计的时间段维度、行为指标维度中的一种或多种维度,对所述用户样本集中用户对所述第一产品池和所述第二产品池的行为数据提取特征,得到所述用户样本集中用户的与品类相关的行为特征,其中,产品粒度包括整体产品池、所述整体产品池中的各级别品类,所述整体产品池包括所述第一产品池和所述第二产品池;用户行为包括搜索、点击、浏览、加购、下单、评价、售后中的一种或多种行为;用户行为统计的时间段包括多种时间窗口;行为指标包括订单量、订单中的产品数量、消费额、最近一次消费距今的天数、访问量、独立访客数、最后一次浏览距今的天数中的一种或多种指标。
6.根据权利要求5所述的方法,其特征在于,所述用户样本集的用户数据还包括录入时间和用户基础数据,所述用户样本集的用户多维特征还包括用户画像特征和/或时间季节性特征;其中:所述用户画像特征是根据所述用户基础数据加工得到的,所述时间季节性特征是对所述用户样本集的用户数据的录入时间进行加工得到的,所述时间季节性特征包括星期、是否为周末、是否为节假日、季节、是否为预设活动期间中的一种或多种特征。7.一种潜在用户的识别装置,其特征在于,包括:用户样本集构造模块,用于基于第一产品池构造用户样本集;第二产品池确定模块,用于利用所述用户样本集中的用...

【专利技术属性】
技术研发人员:李佳璐
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1