一种基于协同过滤与关联规则的服装推荐方法技术

技术编号:26034802 阅读:53 留言:0更新日期:2020-10-23 21:12
本发明专利技术公开了一种基于协同过滤与关联规则的服装推荐方法。本发明专利技术步骤:1.计算根据时间确定训练数据和测试数据,并获取相应的会员标签数据以及产品标签数据;2.基于会员自身的静态属性以及历史购物数据计算两类会员相似性,并通过会员历史购物订单数据和Apriroi算法计算购物记录的关联性,结合会员两类相似性以及关联性结果增加目标会员的历史购物记录;根据新的购物记录中商品标签的购买频率计算目标时间内会员的历史购物偏好;3.基于会员的购物偏好,会员静态属性以及产品静态属性对目标时间内会员的购物记录进行拟合,训练相应的购物概率预测模型,从而给出一份购物概率的推荐排序结果,为会员的精准推荐管理提供科学的参考依据。

【技术实现步骤摘要】
一种基于协同过滤与关联规则的服装推荐方法
本专利技术属于信息
,具体涉及一种基于基于协同过滤与关联规则的服装推荐方法。
技术介绍
随着计算机技术的发展,计算机网络和管理系统几乎应用到服装业各个方面,数据挖掘技术也在服装领域发挥巨大的作用。企业在对会员的经营管理活动中,涉及到各个会员自身的偏好管理,由于购物数据稀缺,依靠人工很难对每一个会员的具体情况进行有针对性的管理,在这个基础上,针对会员的推荐就变得尤为困难。推荐模型和关联规则算法在近期被广泛地应用于服装企业交易数据,当前在服装行业的做法主要由两个方面:一是依据会员动态交互数据(点击,停留,购买等)的线上单品推荐;二是基于所有消费记录下做出的关联性搭配推荐。其中,第一种推荐方案很难满足线下推荐场景,另一方面,随着消费者的偏好越来越多样化,第二种方案也难以对小众偏好的会员给出合适的推荐结果。因此,本专利技术针对这一情况,提出一种基于协同过滤与关联规则结合的服装推荐算法,实现企业对个体会员的精准推荐和管理。
技术实现思路
本专利技术的目的在于补充现有推荐算法在针对线下消费者的推荐效果上的不足,提出一种基于协同过滤与关联规则的服装推荐方法,包括以下步骤:步骤1:将历史数据按指定时间t0和指定时间长度Δt划分为训练数据train_set和测试数据test_set,其中,train_set为销售时间小于t0的所有销售数据,test_set表示销售时间为t0到t0+Δt内的所有销售数据;获取会员静态属性标签{Vi}i∈I以及产品的商品标签{Lq}q∈Q;步骤2:将训练数据train_set按照指定时间长度Δt和会员划分,形成销售分布表{Di,k},其中Di,k表示会员i在[t0-(k+1)Δt,t0-kΔt]时间点段内的销售数据序列,为了方便叙述,后续统一记Δtk=[t0-(k+1)Δt,t0-kΔt];步骤3:基于历史购物记录,计算指定时间段内会员购物记录之间的Jaccard相似度(购物记录相似度)矩阵其中表示会员i与会员j在时间段内的Jaccard相似度;步骤4:根据销售分布表,对每个给定的会员i和指定的时间段使用会员在前的销售数据计算会员的RFM特征,这与会员静态属性特征Vi拼接后并进行one-hot编码,由此得到会员i在时间段内的特征向量根据上述得到的特征向量计算会员属性之间的余弦相似度矩阵(会员属性相似度)其中表示会员i与会员j在时间段内的余弦相似度,所述的会员自身的静态属性标签包括年龄、职业、身高、体型、偏好、忌讳颜色等,所述的会员RFM特征包括上一次购买间隔时长,月均购物频率,单笔购物记录平均价格,上一次购物的价格等;步骤5:基于会员在指定的时间段的销售数据得到指定时间段内的订单数据表其中表示指定的时间段内的第m个订单数据{Lq}q∈Q(m),基于上述订单分布表通过Apriroi算法可计算指定时间段内,商品标签频繁项集的个数n,以及n个频繁项集之间的支持度所述Lq表示订单中产品的商品标签,具体包含大类A,中类A,色系A,版型A,衣长A等;步骤6:对给定的会员i和指定时间段分别根据相似度矩阵相似度矩阵寻找与i最相似的两个会员(不包括已选择过的会员)的销售数据和再结合商品标签的关联度在和中选择与相关联的销售记录补充到会员i的历史购物记录中;步骤7:重复步骤6直到会员i在指定时间段内的销售数据等于模型的输入阈值,增加的销售数据记为步骤8:根据每一个会员在指定时间段前的所有真实购物记录与新增购物记录分别计算该会员对上装和下装的长期购物偏好,短期购物偏好以及季度购物偏好。所述长期购物偏好包括去年同季度会员对各商品标签的购买频率,去年相邻两个季度会员对各商品标签的购买频率等;所述短期购物偏好包括前一个月会员对各商品标签的购买频率,前三个月会员对各商品标签的购买频率以及前六个月会员对各商品标签的购买频率等;所述季度购物偏好包括前会员分别对所有春,夏,秋和冬季各商品标签的购买频率;步骤9:一方面,对于每一个会员i以及给定的时间段从数据库中载入会员i在时刻所到门店的历史库存信息,并借助此库存信息获取会员i在时间段内可以接触到的产品集合Q(i,k0);另一方面,结合步骤3-8,可以计算会员在时的购物偏好此时,我们用f表示真实的购物概率函数,其中f(Vi,Pi,k,Lq)q∈Q(i,k)表示具有Vi特征和Pi,k偏好的会员对具有Lq属性的产品的购买概率,若会员i在Δtk时刻买了产品q,则f(Vi,Pi,k,Lq)=1,反之为0。进一步,构建DeepFM算法在分别在训练集train_set中拟合函数f;步骤10:通过DeepFM算法可以训练得到模型表示模型预测的会员i在Δtk时刻是对产品q的推荐度,在测试集test_set上得到相应的推荐度结果,评估推荐度的准确率,具体仿真环境以及准确率计算公式如下:测试会员选择:在test_set中出现的所有会员;测试产品选择:已知test_set表示销售时间为t0到t0+Δt内(称为Δt-1时刻)的所有销售数据,对每个给定的测试会员i,可以根据历史库存数据获取会员i可以接触的产品集Q(i,-1);推荐结果:若会员没有在Δt-1内购物,则模型不进行推荐;若会员在Δt-1内有购物记录,则模型选择推荐度最高的两个产品作为推荐产品;产品售罄率:模型推荐并且会员在Δt-1时刻购买过的产品数/模型推荐产品数。本专利技术有益成果:本专利技术通过两类相似性的协同过滤方法,综合考虑了会员在自身属性,购买行为以及物品偏好的层次上选择会员有可能购买的产品并补充到会员消费数据中,从而解决会员历史消费数据稀疏,偏好难以判断的问题。同时,本专利技术还应用了关联规则的方法,去筛选控制填补的消费记录,这使得对每个消费数据稀疏的会员而言,本专利技术补充的新增消费记录与会员真实购物的产品有一定的关联性,有很大可能是会员会购买,但是在其他品牌已经购买过的产品,这对于准确判断会员的长短期偏好有很大的帮助,通过在稀疏数据上更好的计算会员的长短期偏好,从而提升主流推荐模型的结果。本专利技术的结果有利于企业对每一个会员进行更加精细化的管理与交互,也能辅助私域流量的运营,从而提升会员活跃度,减少会员流失率。附图说明图1是本专利技术实施例采用该方法的具体流程图。图2是本专利技术实施例采用该方法的结果展示。具体实施方式下面结合附图、附表详细描述本专利技术,本专利技术的目的和效果将变得更加明显。本专利技术考虑到实际情况,根据会员的历史销售数据,采用两类相似性(购物记录相似性,会员自身属性相似性)的协同过滤方法,结果关联规则的结果完善会员的购物数据,从而更准确的计算会员在每个时刻对产品属性的偏好度,进一步,采用主流的DeepFM推荐模型拟合出会员对产品的相关推荐度,本专利技术得到的结果有利于实现会员精细化管理的目的。步骤1:将历史数据按指定时间t0和指定时间长度Δt划分为训练数据train_set和测试数据test_set,其中,train_set为销售时间小于t0的所本文档来自技高网...

【技术保护点】
1.一种基于协同过滤与关联规则的服装推荐方法,其特征在于具体步骤如下:/n步骤1:将历史数据按指定时间t

【技术特征摘要】
1.一种基于协同过滤与关联规则的服装推荐方法,其特征在于具体步骤如下:
步骤1:将历史数据按指定时间t0和指定时间长度Δt划分为训练数据train_set和测试数据test_set,其中,train_set为销售时间小于t0的所有销售数据,test_set表示销售时间为t0到t0+Δt内的所有销售数据;获取会员静态属性标签{Vi}i∈I以及产品的商品标签{Lq}q∈Q;
步骤2:将训练数据train_set按照指定时间长度Δt和会员划分,形成销售分布表{Di,k},其中Di,k表示会员i在[t0-(k+1)Δt,t0-kΔt]时间点段内的销售数据序列,为了方便叙述,后续统一记Δtk=[t0-(k+1)Δt,t0-kΔt];
步骤3:基于历史购物记录,计算指定时间段内会员购物记录之间的Jaccard相似度(购物记录相似度)矩阵其中表示会员i与会员j在时间段内的Jaccard相似度;
步骤4:根据销售分布表,对每个给定的会员i和指定的时间段使用会员在前的销售数据计算会员的RFM特征,将RFM特征与会员静态属性特征Vi拼接后并进行one-hot编码,由此得到会员i在时间段内的特征向量根据得到的特征向量计算会员属性之间的余弦相似度矩阵(会员属性相似度)其中表示会员i与会员j在时间段内的余弦相似度,所述的会员自身的静态属性标签包括年龄、职业、身高、体型、偏好、忌讳颜色,所述的会员RFM特征包括上一次购买间隔时长、月均购物频率、单笔购物记录平均价格和上一次购物的价格;
步骤5:基于会员在指定的时间段的销售数据得到指定时间段内的订单数据表其中表示指定的时间段内的第m个订单数据基于上述订单分布表通过Apriroi算法计算指定时间段内,商品标签频繁项集的个数n,以及n个频繁项集之间的支持度所述Lq表示订单中产品的商品标签,具体包含大类A、中类A、色系A、版型A、衣长A;
步骤6:对给定的会员i和指定时间段分别根据Jaccard相似度矩阵余弦相似度矩阵寻找与i最相似的两个会员(不包括已选择过的会员)的销售数据和再结合商品标签的关联度在和中选择与相...

【专利技术属性】
技术研发人员:王一君陈灿毛嘉宇吴珊珊
申请(专利权)人:杭州览众数据科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1