一种基于大数据的商品推荐方法及装置制造方法及图纸

技术编号:20624539 阅读:35 留言:0更新日期:2019-03-20 15:20
本发明专利技术涉及大数据处理技术领域,具体涉及一种基于大数据的商品推荐方法及装置,通过收集已成交商品的商品数据和用户数据,形成特征样本,进而构建模型;通过获取新用户的行为记录数据,为新用户推荐排序后的商品数据,本发明专利技术能够对新用户提供较高准确度的商品推荐。

A Method and Device of Merchandise Recommendation Based on Big Data

The invention relates to the technical field of large data processing, in particular to a commodity recommendation method and device based on large data, which can collect commodity data and user data of completed commodities, form feature samples, and then construct a model; by acquiring the behavior record data of new users, the commodity data recommended and sorted for new users can be provided with higher accuracy by the invention to new users. Recommendation of commodities with degree of

【技术实现步骤摘要】
一种基于大数据的商品推荐方法及装置
本专利技术涉及大数据处理
,具体涉及一种基于大数据的商品推荐方法及装置。
技术介绍
在家装领域,尤其是地板、瓷砖等用品,用户的复购率一般较低,难以通过用户的历史数据预测购买行为,而在销售过程中,如何准确把握用户的购买需求,进而推荐用户需要的商品是一个十分重要的环节。传统的推荐行为大多根据销售人员的行业经验来判断,而面对新用户时,不确定因素太多,导致推荐商品的准确度起伏较大。基于大数据,通过对前期沉淀的消费者购买行为和商品信息形成比较稳定的购物模型,通过获取新用户的信息数据,形成用户画像,可以提供一种比较稳定的商品推荐方式,因此,如何利用大数据对新用户提供较高准确度的商品推荐成为值得解决的问题。
技术实现思路
本专利技术提供一种基于大数据的商品推荐方法及装置,能够对新用户提供较高准确度的商品推荐。本专利技术提供的一种基于大数据的商品推荐方法,包括以下步骤:步骤A、收集已成交商品的商品数据和用户数据,对所述用户数据进行预处理,形成包含商品数据和用户数据的特征样本;步骤B、根据所述特征样本构建模型;步骤C、获取新用户的行为记录数据;步骤D、为新用户发送排序后的推荐商品数据。进一步,所述步骤A中:所述商品信息包括;商品的名称、型号、规格、价格;所述用户数据包括:用户的个人基本信息、地理位置信息、浏览记录信息、消费记录信息、与所述浏览记录信息、消费记录信息对应的时间信息;所述预处理包括:数据清洗、填充、归一化在内的操作。进一步,所述步骤B具体包括:步骤B1、设置使损失函数极小化的常数值,计算损失函数的负梯度在当前模型的值,作为残差值;步骤B2、设置回归树的叶节点区域,拟合得出残差值;步骤B3、利用线性搜索估计节点区域的值,使损失函数极小化;步骤B4、更新回归树,得到输出的模型。进一步,所述步骤C中新用户的行为记录数据具体包括:用户的个人基本信息、地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息。进一步,所述步骤D具体包括:步骤D1、将所述新用户的行为记录数据与所述模型进行关联度匹配,按关联度排序;其中,对地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息、用户的个人基本信息按由大到小的顺序赋予不同权重;步骤D2、根据匹配的结果获取待推荐的商品信息;步骤D3、将所述待推荐商品按照商品被购买的概率由大到小排列进行排序,生成推荐商品集合;步骤D4、将所述推荐商品集合的商品数据发送给所述新用户。进一步,所述步骤D3中商品被购买的概率由如下公式计算获得:d表示用户购买商品的概率,u表示新用户,in(i)表示指向商品i的商品集合,out(j)表示商品j指向的商品集合,PR(j)表示商品j的被购买概率,PR(i)即为商品i的被购买概率。进一步,所述商品集合根据大于支持度阈值的商品组成,所述支持度表示商品同时被购买的概率,由如下公式计算获得:Freq(A∩B)表示商品A和商品B同时被购买的次数,N表示总销售笔数,Support(A∩B)为商品A和商品B同时被购买的概率,即为商品A和商品B的支持度。本专利技术提供的一种基于大数据的商品推荐装置,包括计算机可读介质,所述介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。本专利技术的有益效果是:本专利技术公开一种基于大数据的商品推荐方法及装置,通过收集已成交商品的商品数据和用户数据,形成特征样本,进而构建模型;通过获取新用户的行为记录数据,为新用户推荐个性化的商品,并对所述商品进行排序,本专利技术能够对新用户提供较高准确度的商品推荐。附图说明下面结合附图和实例对本专利技术作进一步说明。图1是本专利技术实施例一种基于大数据的商品推荐方法的流程图;图2是本专利技术实施例一种基于大数据的商品推荐方法步骤B的流程图;图3是本专利技术实施例一种基于大数据的商品推荐方法步骤D的流程图。具体实施方式参考图1~3,本专利技术实施例提供的一种基于大数据的商品推荐方法,其特征在于,包括以下步骤:步骤A、收集已成交商品的商品数据和用户数据,对所述用户数据进行预处理,形成包含商品数据和用户数据的特征样本;步骤B、根据所述特征样本构建模型;步骤C、获取新用户的行为记录数据;步骤D、为新用户发送排序后的推荐商品数据。进一步,所述步骤A中:所述商品信息包括;商品的名称、型号、规格、价格;所述用户数据包括:用户的个人基本信息、地理位置信息、浏览记录信息、消费记录信息、与所述浏览记录信息、消费记录信息对应的时间信息,所述个人基本信息包括姓名、性别、年龄、电话。所述预处理包括:数据清洗、填充、归一化在内的操作,所述数据清洗包括清除异常数据和无用数据。进一步,所述步骤B具体包括:步骤B1、设置使损失函数极小化的常数值,计算损失函数的负梯度在当前模型的值,作为残差值;步骤B2、设置回归树的叶节点区域,拟合得出残差值;步骤B3、利用线性搜索估计节点区域的值,使损失函数极小化;步骤B4、更新回归树,得到输出的模型。让损失函数沿着梯度方向的下降,利用损失函数的负梯度在当前模型的值作为回归问题提升树算法中的残差的近似值去拟合一个回归树,每轮迭代的时候,都去拟合损失函数在当前模型下的负梯度。通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练,对弱分类器的要求一般是足够简单,并且是低方差和高偏差的,因为训练的过程是通过降低偏差来不断提高最终分类器的精度。进一步,所述步骤C中新用户的行为记录数据具体包括:用户的个人基本信息、地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息。进一步,所述步骤D具体包括:步骤D1、将所述新用户的行为记录数据与所述模型进行关联度匹配,按关联度排序;其中,对地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息、用户的个人基本信息按由大到小的顺序赋予不同权重;步骤D2、根据匹配的结果获取待推荐的商品信息;步骤D3、将所述待推荐商品按照商品被购买的概率由大到小排列进行排序,生成推荐商品集合;步骤D4、将所述推荐商品集合的商品数据发送给所述新用户。进一步,所述步骤D3中商品被购买的概率由如下公式计算获得:d表示用户购买商品的概率,u表示新用户,in(i)表示指向商品i的商品集合,out(j)表示商品j指向的商品集合,PR(j)表示商品j的被购买概率,PR(i)即为商品i的被购买概率。进一步,所述商品集合根据大于支持度阈值的商品组成,所述支持度表示商品同时被购买的概率,由如下公式计算获得:Freq(A∩B)表示商品A和商品B同时被购买的次数,N表示总销售笔数,Support(A∩B)为商品A和商品B同时被购买的概率,即为商品A和商品B的支持度。本专利技术实施例提供的一种基于大数据的商品推荐装置,包括计算机可读介质,所述介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。以上所述,只是本专利技术的较佳实施例而已,本专利技术并不局限于上述实施方式,只要其以相同的手段达到本专利技术的技术效果,都应属于本专利技术的保护范围。本文档来自技高网...

【技术保护点】
1.一种基于大数据的商品推荐方法,其特征在于,包括以下步骤:步骤A、收集已成交商品的商品数据和用户数据,对所述用户数据进行预处理,形成包含商品数据和用户数据的特征样本;步骤B、根据所述特征样本构建模型;步骤C、获取新用户的行为记录数据;步骤D、为新用户发送排序后的推荐商品数据。

【技术特征摘要】
1.一种基于大数据的商品推荐方法,其特征在于,包括以下步骤:步骤A、收集已成交商品的商品数据和用户数据,对所述用户数据进行预处理,形成包含商品数据和用户数据的特征样本;步骤B、根据所述特征样本构建模型;步骤C、获取新用户的行为记录数据;步骤D、为新用户发送排序后的推荐商品数据。2.根据权利要求1所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤A中:所述商品数据包括;商品的名称、型号、规格、价格;所述用户数据包括:用户的个人基本信息、地理位置信息、浏览记录信息、消费记录信息、与所述浏览记录信息、消费记录信息对应的时间信息;所述预处理包括:数据清洗、填充、归一化在内的操作。3.根据权利要求1所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤B具体包括:步骤B1、设置使损失函数极小化的常数值,计算损失函数的负梯度在当前模型的值,作为残差值;步骤B2、设置回归树的叶节点区域,拟合得出残差值;步骤B3、利用线性搜索估计节点区域的值,使损失函数极小化;步骤B4、更新回归树,得到输出的模型。4.根据权利要求1所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤C中新用户的行为记录数据具体包括:用户的个人基本信息、地理位置信息、浏览记录信息、与所述浏览记录信息对应的时间信息。5.根据权利要求1所述的一种基于大数据的商品推荐方法,其特征在于,所述步骤D具体包括:步骤D1、将所述新用户的行为记录数据与所述模型进...

【专利技术属性】
技术研发人员:谭宜颂陈家旺
申请(专利权)人:佛山欧神诺云商科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1