The invention provides a recommended method of fusion rules and hierarchy based on personality, which comprises the following steps: Step 1: \user - item\ behavior information data acquisition; step 2: data preprocessing and feature extraction; step 3: the use of artificial rules on step 2 after the initial data set were selected in accordance with the prediction set the \user - item\ to the prediction set to join Set1, the prediction set all after screening; step 4: Bagging algorithm for two level fusion model of \user - item\ to predict based on prediction of users may purchase items, get the prediction set Set2; step 5: steps 3 and 4 set to get the final prediction and recommended to the user set of goods. The method of the invention the two level fusion model based on Bagging algorithm to solve the recommended effect of single model of the problem of low; prediction using artificial rules to predict some algorithms can not explain the purchase situation, the recommended results recall rate is greatly improved, the comprehensive effect is significant.
【技术实现步骤摘要】
一种基于规则与层级融合的个性推荐方法
本专利技术涉及个性化推荐领域,特别涉及一种基于规则与层级融合的个性推荐方法。
技术介绍
电子商务的个性推荐一直以来是数据挖掘领域的热点问题,使用最为广泛且较为成熟的方法是协同过滤算法,协同过滤算法不需要领域知识,并且能够推荐出“新产品”。但是协同过滤算法的不足也随着时间的推移显现出来,其稀疏性问题,响应时间较长等问题都制约了推荐系统的性能。虽然近几年有不少学者提出了各种协同过滤算法的改进方法,如基于用户购买记录的改进协同过滤推荐,使用用户的购买记录进行偏好挖掘,并改进相似度计算方法(参见文献何有世,宋翠莉.基于用户购买记录的改进协同过滤推荐[J].计算机工程与设计,2014,35(9):3091-3094)。但是在电子商务问题的推荐上,协同过滤算法在相似度上仍有较大的不足。(1)当用户购买了多个物品时,这些物品在相似度计算时的权值如何确定,都取“1”不合适,会对推荐结果带来不同的影响。(2)基于相似度的推荐结果不对称,例如用户购买了手机,为其推荐手机壳是比较理想的推荐结果,但是当用户购买了手机壳,为其推荐手机则是不合常理的。( ...
【技术保护点】
一种基于规则与层级融合的个性推荐方法,其特征在于,包括以下步骤:步骤1:“用户—物品”行为信息数据采集,采集用户在电子商务网站的对各个物品的行为信息,包括时间、用户ID、商品ID和行为,所述行为包括点击、收藏、加入购物车和购买;步骤2:对步骤1得到的数据进行预处理与特征提取,所述数据预处理即对数据进行归一化处理,采用离差标准化方法,对步骤1得到的原始数据进行线性变换,使结果值映射到[0‑1]之间,转换函数如下:
【技术特征摘要】
1.一种基于规则与层级融合的个性推荐方法,其特征在于,包括以下步骤:步骤1:“用户—物品”行为信息数据采集,采集用户在电子商务网站的对各个物品的行为信息,包括时间、用户ID、商品ID和行为,所述行为包括点击、收藏、加入购物车和购买;步骤2:对步骤1得到的数据进行预处理与特征提取,所述数据预处理即对数据进行归一化处理,采用离差标准化方法,对步骤1得到的原始数据进行线性变换,使结果值映射到[0-1]之间,转换函数如下:其中,x为样本原数据,max为样本数据的最大值,min为样本数据的最小值,x*为归一化后的新值;所述特征提取通过选取最能反映用户购买导向的特征进行提取计算;步骤3:使用人工规则筛选经过步骤2处理后的初始数据集得到预测结果集Set1;步骤4:采用二级融合模型对“用户—物品”进行预测,预测用户可能会购买的物品,预测会购买,则将物品标记为1,否则为0;二级融合模型的第一级模型采用逻辑斯蒂回归模型对经过步骤2处理后的初始数据进...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。