用户分类方法及装置、电子设备、存储介质制造方法及图纸

技术编号:16587489 阅读:29 留言:0更新日期:2017-11-18 15:05
本公开涉及一种户分类方法及装置、电子设备、计算机可读存储介质。该用户分类方法包括:选取具有时序性特征的商品品类,并对所选取的商品品类在预设时段内的用户行为数据进行处理统计;根据统计结果生成对应于一用户的时间序列特征;基于一预设算法模型,根据所生成的时间序列特征以及所述预设时段内对应于该用户的参考序列特征得到该用户的分类集群。本公开可提高用户分类的准确度。

User classification method and device, electronic equipment, storage medium

The present disclosure relates to a household classification method and device, an electronic device, and a computer readable storage medium. Including the user classification methods with temporal characteristics of the commodity category, and the user behavior data of selected product categories in preset period for processing statistics; the characteristics of time series according to the statistical results generated corresponding to the user; a preset algorithm model based on cluster reference sequence according to the classification characteristics of time series feature the generated and the preset period corresponding to the user from the user. This disclosure can improve the accuracy of user classification.

【技术实现步骤摘要】
用户分类方法及装置、电子设备、存储介质
本公开涉及计算机
,尤其涉及一种用户分类方法及装置、电子设备、以及计算机可读存储介质。
技术介绍
Word2vec是Google开源的一款将词表征为实数值向量的高效工具,其利用深度学习的思想,通过训练把对文本内容的处理简化为K维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似度。Word2vec的本质是一种文本特征的处理方法,其刻画了每个词与其上下文的词的集合的相关情况,反应了一种序列的特征。在电子商务平台中,基于用户的浏览、收藏、购买等相关行为数据来对用户进行分类,有利于为用户提供更加合适和精准的服务,从而获取良好的用户体验度。以区分用户的年龄群组为例,这类任务需要根据用户的相关行为数据来预测用户的年龄,其主要可以基于用户在一段时间内发生的购买品类数量、各品类购买商品数量、首次购买距今时间等统计类指标作为序列特征,利用某一预设算法模型来对用户所属的年龄段进行分类预测。但是,这类特征无法很好的反应出用户在时间序列上所体现的特征,从而可能影响用户分类的准确度。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种用户分类方法及装置、电子设备、以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种用户分类方法,包括:选取具有时序性特征的商品品类,并对所选取的商品品类在预设时段内的用户行为数据进行处理统计;根据统计结果生成对应于一用户的时间序列特征;基于一预设算法模型,根据所生成的时间序列特征以及所述预设时段内对应于该用户的参考序列特征得到该用户的分类集群。本公开的一种示例性实施例中,选取具有时序性特征的商品品类包括:选取具有季节性特征的商品品类;或者,选取具有时间周期性特征的商品品类;或者,选取具有生命周期性特征的商品品类。本公开的一种示例性实施例中,选取具有时序性特征的商品品类还包括:选取用户覆盖率大于预设门槛值的商品品类;其中,所述用户覆盖率为关注一商品品类的用户数量与总用户数量的比值。本公开的一种示例性实施例中,对所选取的商品品类在预设时段内的用户行为数据进行统计包括:获取所选取的商品品类在预设时段内的用户浏览记录、用户收藏记录、用户加购记录、以及用户购买记录中的至少一种用户行为数据;自所述至少一种用户行为数据中提取不同维度的多项特征指标,并对所述特征指标进行归一化处理;对归一化处理后的所述特征指标进行多维度统计。本公开的一种示例性实施例中,对所述特征指标进行归一化处理包括:对所述特征指标进行正向化处理;和/或,对所述特征指标进行标准化处理。本公开的一种示例性实施例中,对所述特征指标进行正向化处理包括:针对逆向指标,根据公式Xnew=Max(X)-X进行正向化处理;其中,X为逆向指标数据,Xnew为正向化处理后的数据,MAX(X)为正向化处理前的逆向指标数据的最大值。本公开的一种示例性实施例中,对所述特征指标进行标准化处理包括:根据公式Xnew=[X-mean(X)]/std(X)进行标准化处理;其中,X为标准化处理前的数据,Xnew为标准化处理后的数据,mean(X)为标准化处理前的数据的平均值,std(X)为标准化处理前的数据的标准差。本公开的一种示例性实施例中,根据统计结果生成对应于一用户的时间序列特征包括:根据统计结果获取对应于一用户的多个预分类集群,并计算该用户与每个所述预分类集群之间的相似系数;其中,该用户对应的各个所述预分类集群以及与每个所述预分类集群之间的相似系数构成所述时间序列特征。本公开的一种示例性实施例中,根据统计结果获取对应于一用户的多个预分类集群包括:根据统计结果获取该用户对应的多个年龄段集群。本公开的一种示例性实施例中,根据所生成的时间序列特征以及所述预设时段内对应于该用户的参考序列特征得到该用户的分类集群包括:根据所生成的时间序列特征以及所述预设时段内该用户的所有订单中的商品品类数量得到该用户的分类集群;和/或,根据所生成的时间序列特征以及所述预设时段内该用户的所有订单中的任一商品品类的首次购买距今时间得到该用户的分类集群;和/或,根据所生成的时间序列特征以及所述预设时段内该用户的所有订单中的各商品品类购买数量得到该用户的分类集群。根据本公开的一个方面,提供一种用户分类装置,包括:统计模块,用于选取具有时序性特征的商品品类,并对所选取的商品品类在预设时段内的用户行为数据进行处理统计;生成模块,用于根据统计结果生成对应于一用户的时间序列特征;分类模块,用于基于一预设算法模型,根据所生成的时间序列特征以及所述预设时段内对应于该用户的参考序列特征得到该用户的分类集群。根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述的用户分类方法。根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的用户分类方法。本公开示例性实施方式所提供的用户分类方法及装置,通过选取具有时序性特征的商品品类以反应用户在时间序列上所体现出的特征,并结合其它方面的参考特征,基于一预设算法模型来对用户进行分类。这样一来,由于在进行用户分类时综合考虑了包括时间序列特征的多种因素,因此可以有效的提升用户分类的准确度,使得营销更为精准,从而满足不同场景的多样性营销需求。经过验证,基于本示例实施方式所提供的用户分类方法,针对同样的算法模型可使用户分类的准确度提升3%左右。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出本公开示例性实施例中用户分类方法的流程图;图2示意性示出本公开示例性实施例中用户分类方法的模型框图;图3示意性示出本公开示例性实施例中用户分类方法的系统流程图;图4示意性示出本公开示例性实施例中用户行为数据经过特征指标的归一化处理后的数据样例一;图5示意性示出本公开示例性实施例中用户行为数据经过特征指标的归一化处理后的数据样例二;图6示意性示出本公开示例性实施例中用户行为数据经过特征指标的归一化处理后的数据样例三;图7示意性示出本公开示例性实施例中所获取的时间序列特征数据;图8示意性示出本公开示例性实施例中算法模型的输入序列数据;图9示意性示出本公开示例性实施例中用户分类装置的示意框图;图10示意性示出本公开示例性实施例中电子设备的模块示意图;图11示意性示出本公开示例性实施例中程序产品的示意图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理本文档来自技高网...
用户分类方法及装置、电子设备、存储介质

【技术保护点】
一种用户分类方法,其特征在于,包括:选取具有时序性特征的商品品类,并对所选取的商品品类在预设时段内的用户行为数据进行处理统计;根据统计结果生成对应于一用户的时间序列特征;基于一预设算法模型,根据所生成的时间序列特征以及所述预设时段内对应于该用户的参考序列特征得到该用户的分类集群。

【技术特征摘要】
1.一种用户分类方法,其特征在于,包括:选取具有时序性特征的商品品类,并对所选取的商品品类在预设时段内的用户行为数据进行处理统计;根据统计结果生成对应于一用户的时间序列特征;基于一预设算法模型,根据所生成的时间序列特征以及所述预设时段内对应于该用户的参考序列特征得到该用户的分类集群。2.根据权利要求1所述的用户分类方法,其特征在于,选取具有时序性特征的商品品类包括:选取具有季节性特征的商品品类;或者,选取具有时间周期性特征的商品品类;或者,选取具有生命周期性特征的商品品类。3.根据权利要求2所述的用户分类方法,其特征在于,选取具有时序性特征的商品品类还包括:选取用户覆盖率大于预设门槛值的商品品类;其中,所述用户覆盖率为关注一商品品类的用户数量与总用户数量的比值。4.根据权利要求1所述的用户分类方法,其特征在于,对所选取的商品品类在预设时段内的用户行为数据进行统计包括:获取所选取的商品品类在预设时段内的用户浏览记录、用户收藏记录、用户加购记录、以及用户购买记录中的至少一种用户行为数据;自所述至少一种用户行为数据中提取不同维度的多项特征指标,并对所述特征指标进行归一化处理;对归一化处理后的所述特征指标进行多维度统计。5.根据权利要求4所述的用户分类方法,其特征在于,对所述特征指标进行归一化处理包括:对所述特征指标进行正向化处理;和/或,对所述特征指标进行标准化处理。6.根据权利要求5所述的用户分类方法,其特征在于,对所述特征指标进行正向化处理包括:针对逆向指标,根据公式Xnew=Max(X)-X进行正向化处理;其中,X为逆向指标数据,Xnew为正向化处理后的数据,MAX(X)为正向化处理前的逆向指标数据的最大值。7.根据权利要求5所述的用户分类方法,其特征在于,对所述特征指标进行标准化处理包括:根据公式Xnew=[X-mean(X)]/std(X)进行标准化处理;其中,X为标准化处理前的数据,Xnew为标准化处理后的数...

【专利技术属性】
技术研发人员:卢月葛胜利李爱华
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1