基于随机森林的产品推荐方法、装置及介质制造方法及图纸

技术编号：22101930 阅读：18 留言：0更新日期：2019-09-14 03:20

本发明专利技术涉及智能决策，提供一种基于随机森林的产品推荐方法，包括：获取多个用户用户特征对应的特征变量；将特征变量划分为连续变量和离散变量；检查离散变量的离散值数量，将超过设定离散值数量的离散变量作为第一类离散变量，不超过设定离散值数量的离散变量作为第二类离散变量；对第一类离散变量进行衍生处理，建立衍生特征；对第一类离散变量采用K‑Modes对离散变量进行聚类，输出类别标签；构建随机森林模型，将第一类离散变量的类别标签和衍生特征、第二类离散变量和连续变量输入随机森林模型，实现人群分类；对不同人群分类类别的用户推荐不同产品。本发明专利技术还提供一种电子装置及存储介质。本发明专利技术适用于离散值较多的离散变量。

Product Recommendation Method, Device and Medium Based on Random Forest

全部详细技术资料下载

【技术实现步骤摘要】
基于随机森林的产品推荐方法、装置及介质
本专利技术涉及智能决策
，更为具体地，涉及一种基于随机森林的产品推荐方法、装置及介质。
技术介绍
在现有人群分类模型中，离散变量会被转化为数值标签或者被衍生为多个变量，而这一处理方法对于离散值较多的变量则不适用，不能对人群进行准确分类，存在分类混淆甚至分类错误的情况，从而不能够推荐符合用户偏好的产品。
技术实现思路
鉴于上述问题，本专利技术的目的是提供一种适用于离散值较多的离散变量，提高人群分类的准确性，推荐符合用户偏好产品的基于随机森林的产品推荐方法、电子装置及存储介质。为了实现上述目的，本专利技术提供一种电子装置，所述电子装置包括存储器和处理器，所述存储器中包括基于随机森林的产品推荐程序，所述基于随机森林的产品推荐程序被所述处理器执行时实现如下步骤：获取多个用户的用户特征对应的特征变量，所述用户特征包括年龄、职业、城市、性别、籍贯、学历、购买产品的数额，购买产品的次数和购买产品的类别中的一个或多个；将所述特征变量划分为连续变量和离散变量，所述连续变量是具有次序属性的数值型变量，所述离散变量是非数值型变量；检查所述离散变量的离散值数量，将超过设定离散值数量的离散变量作为第一类离散变量，不超过设定离散值数量的离散变量作为第二类离散变量；对第一类离散变量进行衍生处理，建立衍生特征；对第一类离散变量采用K-Modes对离散变量进行聚类，输出类别标签；构建随机森林模型，将第一类离散变量的类别标签和衍生特征、第二类离散变量和连续变量输入所述随机森林模型，实现人群分类；对不同人群分类类别的用户推荐不同产品。此外，为了实现上述...

【技术保护点】
1.一种基于随机森林的产品推荐方法，其特征在于，包括：获取多个用户的用户特征对应的特征变量，所述用户特征包括年龄、职业、城市、性别、籍贯、学历、购买产品的数额，购买产品的次数和购买产品的类别中的一个或多个；将所述特征变量划分为连续变量和离散变量，所述连续变量是具有次序属性的数值型变量，所述离散变量是非数值型变量；检查所述离散变量的离散值数量，将超过设定离散值数量的离散变量作为第一类离散变量，不超过设定离散值数量的离散变量作为第二类离散变量；对第一类离散变量进行衍生处理，建立衍生特征；对第一类离散变量采用K‑Modes进行聚类，输出类别标签；构建随机森林模型，将第一类离散变量的类别标签和衍生特征、第二类离散变量和连续变量输入所述随机森林模型，实现人群分类；对不同人群分类类别的用户推荐不同产品。

【技术特征摘要】
1.一种基于随机森林的产品推荐方法，其特征在于，包括：获取多个用户的用户特征对应的特征变量，所述用户特征包括年龄、职业、城市、性别、籍贯、学历、购买产品的数额，购买产品的次数和购买产品的类别中的一个或多个；将所述特征变量划分为连续变量和离散变量，所述连续变量是具有次序属性的数值型变量，所述离散变量是非数值型变量；检查所述离散变量的离散值数量，将超过设定离散值数量的离散变量作为第一类离散变量，不超过设定离散值数量的离散变量作为第二类离散变量；对第一类离散变量进行衍生处理，建立衍生特征；对第一类离散变量采用K-Modes进行聚类，输出类别标签；构建随机森林模型，将第一类离散变量的类别标签和衍生特征、第二类离散变量和连续变量输入所述随机森林模型，实现人群分类；对不同人群分类类别的用户推荐不同产品。2.根据权利要求1所述的基于随机森林的产品推荐方法，其特征在于，在第一类离散变量的类别标签和衍生特征、第二类离散变量和连续变量输入所述随机森林模型步骤之前还包括对第二类离散变量进行处理的步骤，包括：对离散特征为无序离散值的第二类离散变量进行编码；对离散特征为有序离散值的第二类离散变量进行量化处理。3.根据权利要求1所述的基于随机森林的产品推荐方法，其特征在于，所述对第一类离散变量采用K-Modes对离散变量进行聚类的步骤和构建随机森林模型的步骤还包括：设定不同的聚类数量；采用已经确定分群类别的用户的第一类离散变量分别进行不同聚类数量的K-Modes聚类，针对每一K-Modes模型，建立相应随机森林模型，获得不同聚类数量对应的随机森林模型；通过人群分类预测精度选取最佳聚类数量及其对应的K-Modes模型和随机森林模型。4.根据权利要求3所述的基于随机森林的产品推荐方法，其特征在于，所述通过人群分类预测精度选取最佳聚类数量的步骤包括：获得随机森林人群分类预测精度随聚类数量的变化趋势，对聚类数量进行调整，获得最佳聚类数量。5.根据权利要求3所述的基于随机森林的产品推荐方法，其特征在于，通过人群分类预测精度选取最佳聚类数量及其对应的K-Modes模型和随机森林模型之后还包括：通过网格搜索对选取的随机森林模型进行调参。6.根据权利要求1所述的基于随机森林的产品推荐方法，其特征在于所述对第一类离散变量采用K-Modes对离散变量进行聚类的步骤包括：步骤一：随机确定k个聚类中心L1，L2…LK，Li是长度为M的向量，...

【专利技术属性】
技术研发人员：金戈，徐亮，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人