一种基于规则与层级融合的个性推荐方法技术

技术编号：16457967 阅读：24 留言：0更新日期：2017-10-25 22:37

本发明专利技术提供一种基于规则与层级融合的个性推荐方法，包括以下步骤：步骤1：“用户—物品”行为信息数据采集；步骤2：数据预处理与特征提取；步骤3：使用人工规则对步骤2处理后的初始数据集进行筛选，符合预测集的“用户—物品”对加入到预测集，全部筛选完后得到预测集Set1；步骤4：基于Bagging算法的二级融合模型对“用户—物品”对进行预测，预测用户可能会购买的物品，得到预测集Set2；步骤5：步骤3和步骤4的预测集取并集得到最终推荐给用户商品集。本发明专利技术基于Bagging算法的两级模型融合的方法解决了单模型的推荐效果较低的问题；使用一定的人工规则进行预测，预测出了一些算法不能解释的购买情况，使推荐结果的召回率大大提高，综合效果较为显著。

A personalized recommendation method based on rule and hierarchical fusion

The invention provides a recommended method of fusion rules and hierarchy based on personality, which comprises the following steps: Step 1: \user - item\ behavior information data acquisition; step 2: data preprocessing and feature extraction; step 3: the use of artificial rules on step 2 after the initial data set were selected in accordance with the prediction set the \user - item\ to the prediction set to join Set1, the prediction set all after screening; step 4: Bagging algorithm for two level fusion model of \user - item\ to predict based on prediction of users may purchase items, get the prediction set Set2; step 5: steps 3 and 4 set to get the final prediction and recommended to the user set of goods. The method of the invention the two level fusion model based on Bagging algorithm to solve the recommended effect of single model of the problem of low; prediction using artificial rules to predict some algorithms can not explain the purchase situation, the recommended results recall rate is greatly improved, the comprehensive effect is significant.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于规则与层级融合的个性推荐方法
本专利技术涉及个性化推荐领域，特别涉及一种基于规则与层级融合的个性推荐方法。
技术介绍
电子商务的个性推荐一直以来是数据挖掘领域的热点问题，使用最为广泛且较为成熟的方法是协同过滤算法，协同过滤算法不需要领域知识，并且能够推荐出“新产品”。但是协同过滤算法的不足也随着时间的推移显现出来，其稀疏性问题，响应时间较长等问题都制约了推荐系统的性能。虽然近几年有不少学者提出了各种协同过滤算法的改进方法，如基于用户购买记录的改进协同过滤推荐，使用用户的购买记录进行偏好挖掘，并改进相似度计算方法(参见文献何有世,宋翠莉.基于用户购买记录的改进协同过滤推荐[J].计算机工程与设计,2014,35(9):3091-3094)。但是在电子商务问题的推荐上，协同过滤算法在相似度上仍有较大的不足。(1)当用户购买了多个物品时，这些物品在相似度计算时的权值如何确定，都取“1”不合适，会对推荐结果带来不同的影响。(2)基于相似度的推荐结果不对称，例如用户购买了手机，为其推荐手机壳是比较理想的推荐结果，但是当用户购买了手机壳，为其推荐手机则是不合常理的。(3)计算相似度矩阵时，用户的点击、收藏等多种行为无法刻画，只使用购买记录对信息则会造成巨大的浪费。(4)当相似度矩阵极度稀疏时，算法的效率较低。
技术实现思路
为了解决传统的推荐方法响应时间较长，因稀疏性、用户数据信息利用率不高等导致推荐效果不理想的问题，本专利技术提供一种基于规则与层级融合的个性推荐方法，使推荐结果更符合用户期望。为了解决上述技术问题，其技术解决方案为：一种基于规则与层级融合的个性推...

【技术保护点】
一种基于规则与层级融合的个性推荐方法，其特征在于，包括以下步骤：步骤1：“用户—物品”行为信息数据采集，采集用户在电子商务网站的对各个物品的行为信息，包括时间、用户ID、商品ID和行为，所述行为包括点击、收藏、加入购物车和购买；步骤2：对步骤1得到的数据进行预处理与特征提取，所述数据预处理即对数据进行归一化处理，采用离差标准化方法，对步骤1得到的原始数据进行线性变换，使结果值映射到[0‑1]之间，转换函数如下：

【技术特征摘要】
1.一种基于规则与层级融合的个性推荐方法，其特征在于，包括以下步骤：步骤1：“用户—物品”行为信息数据采集，采集用户在电子商务网站的对各个物品的行为信息，包括时间、用户ID、商品ID和行为，所述行为包括点击、收藏、加入购物车和购买；步骤2：对步骤1得到的数据进行预处理与特征提取，所述数据预处理即对数据进行归一化处理，采用离差标准化方法，对步骤1得到的原始数据进行线性变换，使结果值映射到[0-1]之间，转换函数如下：其中，x为样本原数据，max为样本数据的最大值，min为样本数据的最小值，x*为归一化后的新值；所述特征提取通过选取最能反映用户购买导向的特征进行提取计算；步骤3：使用人工规则筛选经过步骤2处理后的初始数据集得到预测结果集Set1；步骤4：采用二级融合模型对“用户—物品”进行预测，预测用户可能会购买的物品，预测会购买，则将物品标记为1，否则为0；二级融合模型的第一级模型采用逻辑斯蒂回归模型对经过步骤2处理后的初始数据进...

【专利技术属性】
技术研发人员：王雨，商锦，
申请(专利权)人：武汉科技大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人