The present disclosure relates to a household classification method and device, an electronic device, and a computer readable storage medium. Including the user classification methods with temporal characteristics of the commodity category, and the user behavior data of selected product categories in preset period for processing statistics; the characteristics of time series according to the statistical results generated corresponding to the user; a preset algorithm model based on cluster reference sequence according to the classification characteristics of time series feature the generated and the preset period corresponding to the user from the user. This disclosure can improve the accuracy of user classification.
【技术实现步骤摘要】
用户分类方法及装置、电子设备、存储介质
本公开涉及计算机
,尤其涉及一种用户分类方法及装置、电子设备、以及计算机可读存储介质。
技术介绍
Word2vec是Google开源的一款将词表征为实数值向量的高效工具,其利用深度学习的思想,通过训练把对文本内容的处理简化为K维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似度。Word2vec的本质是一种文本特征的处理方法,其刻画了每个词与其上下文的词的集合的相关情况,反应了一种序列的特征。在电子商务平台中,基于用户的浏览、收藏、购买等相关行为数据来对用户进行分类,有利于为用户提供更加合适和精准的服务,从而获取良好的用户体验度。以区分用户的年龄群组为例,这类任务需要根据用户的相关行为数据来预测用户的年龄,其主要可以基于用户在一段时间内发生的购买品类数量、各品类购买商品数量、首次购买距今时间等统计类指标作为序列特征,利用某一预设算法模型来对用户所属的年龄段进行分类预测。但是,这类特征无法很好的反应出用户在时间序列上所体现的特征,从而可能影响用户分类的准确度。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种用户分类方法及装置、电子设备、以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一个方面,提供一种用户分类方法,包括:选取具有 ...
【技术保护点】
一种用户分类方法,其特征在于,包括:选取具有时序性特征的商品品类,并对所选取的商品品类在预设时段内的用户行为数据进行处理统计;根据统计结果生成对应于一用户的时间序列特征;基于一预设算法模型,根据所生成的时间序列特征以及所述预设时段内对应于该用户的参考序列特征得到该用户的分类集群。
【技术特征摘要】
1.一种用户分类方法,其特征在于,包括:选取具有时序性特征的商品品类,并对所选取的商品品类在预设时段内的用户行为数据进行处理统计;根据统计结果生成对应于一用户的时间序列特征;基于一预设算法模型,根据所生成的时间序列特征以及所述预设时段内对应于该用户的参考序列特征得到该用户的分类集群。2.根据权利要求1所述的用户分类方法,其特征在于,选取具有时序性特征的商品品类包括:选取具有季节性特征的商品品类;或者,选取具有时间周期性特征的商品品类;或者,选取具有生命周期性特征的商品品类。3.根据权利要求2所述的用户分类方法,其特征在于,选取具有时序性特征的商品品类还包括:选取用户覆盖率大于预设门槛值的商品品类;其中,所述用户覆盖率为关注一商品品类的用户数量与总用户数量的比值。4.根据权利要求1所述的用户分类方法,其特征在于,对所选取的商品品类在预设时段内的用户行为数据进行统计包括:获取所选取的商品品类在预设时段内的用户浏览记录、用户收藏记录、用户加购记录、以及用户购买记录中的至少一种用户行为数据;自所述至少一种用户行为数据中提取不同维度的多项特征指标,并对所述特征指标进行归一化处理;对归一化处理后的所述特征指标进行多维度统计。5.根据权利要求4所述的用户分类方法,其特征在于,对所述特征指标进行归一化处理包括:对所述特征指标进行正向化处理;和/或,对所述特征指标进行标准化处理。6.根据权利要求5所述的用户分类方法,其特征在于,对所述特征指标进行正向化处理包括:针对逆向指标,根据公式Xnew=Max(X)-X进行正向化处理;其中,X为逆向指标数据,Xnew为正向化处理后的数据,MAX(X)为正向化处理前的逆向指标数据的最大值。7.根据权利要求5所述的用户分类方法,其特征在于,对所述特征指标进行标准化处理包括:根据公式Xnew=[X-mean(X)]/std(X)进行标准化处理;其中,X为标准化处理前的数据,Xnew为标准化处理后的数...
【专利技术属性】
技术研发人员:卢月,葛胜利,李爱华,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。