【技术实现步骤摘要】
用户分类方法、系统、电子设备及计算机可读介质
本公开涉及大数据处理
,更具体地,涉及一种用户分类方法、系统、电子设备及计算机可读介质。
技术介绍
随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。用户数据作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础,奠定了大数据时代的基石。用户数据,即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。用户数据为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。然而,各个电商目前针对三级品类偏爱度的标签,一般采用KMeans算法对用户数据迭代聚类。但是在实现本专利技术构思的过程中,专利技术人发现现有技术中至少存在如下问题:采用KMeans算法对用户数据迭代聚类的结果准确度不高,在执行该算法之前需要人工设定聚类中心点,因此容易陷入局部 ...
【技术保护点】
1.一种用户分类方法,包括:获取待分类的用户数据,所述用户数据包括多个用户中每个用户的多个特征;对所述多个用户进行自适应聚类,得到每个聚类的中心点的初始值和聚类数目;以及根据所述每个聚类的中心点的初始值和所述聚类数目,对所述多个用户进行迭代聚类,将所述多个用户分为多个用户类。
【技术特征摘要】
1.一种用户分类方法,包括:获取待分类的用户数据,所述用户数据包括多个用户中每个用户的多个特征;对所述多个用户进行自适应聚类,得到每个聚类的中心点的初始值和聚类数目;以及根据所述每个聚类的中心点的初始值和所述聚类数目,对所述多个用户进行迭代聚类,将所述多个用户分为多个用户类。2.根据权利要求1所述的方法,其中,所述多个用户是特定时间段内购买过相同商品品类的多个用户。3.根据权利要求1所述的方法,其中,所述多个特征包括所述用户在特定时间段内的以下任意一个或多个特征:购物次数、购物金额、使用优惠券金额占订单总金额的比重、浏览购物界面的总时长、登录购物界面的次数、最近一次下单距离当前时间的时长、购买商品的总数量、购买商品的品类总数量、加入购物车的商品数量、浏览的商品总数量、和浏览商品的品类总数量。4.根据权利要求1所述的方法,还包括:获取用户数据集合;对所述用户数据集合中的用户数据,按照相应用户购买的商品品类进行分类得到一个或多个用户数据子集;以及将至少一个用户数据子集作为所述待分类的用户数据,执行所述自适应聚类和所述迭代聚类。5.根据权利要求1所述的方法,其中:自适应聚类包括通过自组织映射算法进行自适应聚类;并且/或者迭代聚类包括通过KMeans算法进行迭代聚类。6.根据权利要求1所述的方法,还包括:根据迭代聚类得到的每个用户类的类别内误差以及所有类的类别内误差计算验证参数;以及在所述验证参数不符合预定条件的情况下,修改以下的任意一项或多项:用户特征的选择、自适应聚类的聚类参数、和迭代聚类的聚类参数。7.一种用户分类系统,包括:第一获取模块,用于获取待分类的用户数据,所述用户数据包括多个用户中每个用户的多个特征;第一聚类模块,用于对所述多个用户进行自适应聚类,得到每个聚类的中心点的初始值和聚...
【专利技术属性】
技术研发人员:白文庆,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。