基于用户重复行为模式挖掘的短序列推荐方法技术

技术编号:27416401 阅读:25 留言:0更新日期:2021-02-21 14:33
本发明专利技术公开了一种基于用户重复行为模式挖掘的短序列推荐方法,包括以下步骤:1)对于给定的用户行为序列进行物品表示学习,获得物品的特征表示;2)将用户的行为序列转换成重复行为模式序列,进行重复行为的物品选择概率预测:根据重复行为模式序列预测序列中每个物品在下一次被重新点击的概率;3)进行探索行为的物品选择概率预测:预测没有在用户的行为序列中出现过的每个物品在下一次行为中被点击的概率;4)计算用户进行重复行为和探索行为的概率分布;5)根据步骤2)至步骤4)的结果,获得每个物品在下一次被点击的概率。本发明专利技术通过对用户的重复行为进行建模,并捕捉序列中的长距离依赖关系,可有效提高对用户推荐物品的准确度。高对用户推荐物品的准确度。高对用户推荐物品的准确度。

【技术实现步骤摘要】
基于用户重复行为模式挖掘的短序列推荐方法


[0001]本专利技术涉及数据挖掘
,尤其涉及一种基于用户重复行为模式挖掘的短序列推荐方法。

技术介绍

[0002]传统的短序列推荐方法通常基于序列模式挖掘或一阶马尔科夫链,但前者通常只关注那些出现频率高的物品,后者只建模短期的依赖关系而忽略长期的依赖关系,难以获取准确的预测结果。随着深度学习的进步,许多基于深度神经网络的模型致力于增强短序列推荐任务的效果,其中大多数研究工作主要基于循环神经网络(Recurrent Neural Network)和自注意力机制(Self-Attention)构建架构,尽管这些模型在短序列推荐任务上展现出一定的提升,但循环神经网络难以关注上下文之间的依赖关系,自注意力机制忽略了对物品时间顺序的建模,仍然具有明显的缺点。此外当前工作忽视了对用户行为模式的挖掘,从而难以对用户的重复行为进行建模,因此具有很大的局限性。

技术实现思路

[0003]本专利技术要解决的技术问题在于针对现有技术中的缺陷,提供一种基于用户重复行为模式挖掘的短序列推荐方法。
[0004]本专利技术解决其技术问题所采用的技术方案是:一种基于用户重复行为模式挖掘的短序列推荐方法,包括以下步骤:
[0005]1)对于给定的用户行为序列进行物品表示学习,获得物品的特征表示;序列中的每一项代表一个物品,按照用户与物品交互行为的时间顺序排列;为行为序列s中第i个交互的物品;
[0006]2)将用户的行为序列转换成重复行为模式序列,进行重复行为的物品选择概率预测:根据重复行为模式序列预测序列中每个物品在下一次被重新点击的概率;
[0007]3)进行探索行为的物品选择概率预测:预测没有在用户的行为序列中出现过的每个物品在下一次行为中被点击的概率;
[0008]4)计算用户进行重复行为和探索行为的概率分布;
[0009]5)根据步骤2)至步骤4)的结果,获得每个物品在下一次被点击的概率,依据概率进行推荐;
[0010]P(v
i
|S)=P(r|S)P(v
i
|r,S)+P(e|S)P(v
i
|e,S)
[0011]其中,Pr(r|S)和Pr(e|S)分别代表用户进行重复行为的概率和用户进行探索行为的概率,Pr(v|r,S)和Pr(v|e,S)分别代表着在重复行为中推荐物品v的概率和在探索行为中推荐物品v的概率。
[0012]按上述方案,所述步骤1)中进行物品表示学习,获得物品的特征表示,具体如下:
[0013]1.1)使用嵌入层将每个物品v
i
映射到一个低维隐空间中,物品向量h
i
代表物品v
i
对应的d维向量;
[0014]1.2)对于给定的序列让G
s
=(V
s
,E
s
)代表对应的有向序列图,其中,v
i
∈V
s
和e
ij
∈E
s
代表序列图G
s
中的每一个点和边,序列图中的点对应着序列中不同的物品,序列图中的边由物品相似度确定,所构造的序列图G
s
是一张有向图,在这里用和代表v
i
的入邻居(在序列中出现在v
i
之前)和出邻居(在序列中出现在v
i
之后);
[0015]1.3)根据所构造的序列图G
s
,首先通过平均池化层处理两种类型的邻居并得到其特征表示,
[0016][0017][0018]通过图神经网络来将每个物品的特征与其邻居的特征结合,并在网络中添加残差连接,从而获取这些物品的新的特征表示,
[0019][0020]其中,||代表向量的拼接操作,h

i
代表物品v
i
的新的特征表示,W
s
,W
N
和b
N
是训练的参数,tanh代表双曲正切激活函数。
[0021]按上述方案,所述步骤1.2)中物品相似度采用余弦相似度计算。
[0022]按上述方案,所述步骤2)中重复行为模式序列R(S)通过如下方式获取:
[0023]给定一个序列则
[0024][0025]其中,代表着首次出现在序列S中时,序列中不同物品的数目,
[0026][0027]按上述方案,所述步骤2)中根据重复行为模式序列预测序列中每个物品在下一次被重新点击的概率,具体如下:
[0028]2.1)在将序列S转换成重复行为模式R(S)之后,这里首先将每个不同的R(S)编码成对应的独热(one-hot)编码u
R(S)
,然后利用嵌入层将u
R(S)
映射成低维向量u
R(S)

[0029]2.2)训练一个位置特征矩阵P={p1,p2,

,p
n
},来将每个位置编码成向量编码,此处位置特征采用正向位置或反向位置;
[0030]通过神经网络学习重复行为模式对于不同位置上的物品的影响,
[0031]m
i
=tanh(W
m
[p
n-i+1
||u
R(S)
]+b
m
)
[0032]其中,W
m
和b
m
是训练的参数,将学习到的向量和每个物品自身的特征相结合,并通过全连接网络给每个物品进行打分,通过softmax函数对分数进行归一化得到最终的概率值,
[0033][0034][0035]其中,W
r
,U
r
,q
r
和b
r
都是训练的参数。
[0036]按上述方案,所述步骤3)中预测没有在用户的行为序列中出现过的每个物品在下一次行为中被点击的概率,具体如下:
[0037]3.1)使用注意力机制来学习每个物品的重要性权重;
[0038][0039]其中,W
e
,U
e
,q
e
和b
e
都是训练的参数,
[0040]3.2)使用softmax来对重要性权重进行归一化,序列的特征表示通过对每个物品的特征表示进行加权求和得到,
[0041]α
i
=softmax(α
i
)
[0042][0043]s

e
=tanh(W
s
s
e
+b
s
)+s
e
[0044]基于所学习到的序列特征表示s

e
,每个物品的分数通过自身特征和序列特征s

e
进行内积所获取,
...

【技术保护点】

【技术特征摘要】
1.一种基于用户重复行为模式挖掘的短序列推荐方法,其特征在于,包括以下步骤:1)对于给定的用户行为序列进行物品表示学习,获得物品的特征表示;序列中的每一项代表一个物品,按照用户与物品交互行为的时间顺序排列;为行为序列s中第i个交互的物品;2)将用户的行为序列转换成重复行为模式序列,进行重复行为的物品选择概率预测:根据重复行为模式序列预测序列中每个物品在下一次被重新点击的概率;3)进行探索行为的物品选择概率预测:预测没有在用户的行为序列中出现过的每个物品在下一次行为中被点击的概率;4)计算用户进行重复行为和探索行为的概率分布;5)根据步骤2)至步骤4)的结果,获得每个物品在下一次被点击的概率;P(v
i
|S)=P(r|S)P(v
i
|r,S)+P(e|S)P(v
i
|e,S)其中,Pr(r|S)和Pr(e|S)分别代表用户进行重复行为的概率和用户进行探索行为的概率,Pr(v|r,S)和Pr(v|e,S)分别代表着在重复行为中推荐物品v的概率和在探索行为中推荐物品v的概率。2.根据权利要求1所述的基于用户重复行为模式挖掘的短序列推荐方法,其特征在于,所述步骤1)中进行物品表示学习,获得物品的特征表示,具体如下:1.1)使用嵌入层将每个物品v
i
映射到一个低维隐空间中,物品向量h
i
代表物品v
i
对应的d维向量;1.2)对于给定的序列让G
s
=(V
s
,E
s
)代表对应的有向序列图,其中,v
i
∈V
s
和e
ij
∈E
s
代表序列图G
s
中的每一个点和边,序列图中的点对应着序列中不同的物品,序列图中的边由物品相似度确定,所构造的序列图G
s
是一张有向图,在这里用和代表v
i
的入邻居(在序列中出现在v
i
之前)和出邻居(在序列中出现在v
i
之后);1.3)根据所构造的序列图G
s
,首先通过平均池化层处理两种类型的邻居并得到其特征表示,表示,通过图神经网络来将每个物品的特征与其邻居的特征结合,并在网络中添加残差连接,从而获取这些物品的新的特征表示,其中,||代表向量的拼接操作,h

i
代表物品v
i
的新的特征表示,W
s
,W
N
和b
N
是训练的参数,tanh代表双曲正切激活函数。3.根据权利要求2所述的基于用户重复行为模式挖掘的短序列推荐方法,其特征在于,所述步骤1.2)中物品相似度采用余弦相似度计算。4.根据权利要求1所述的基于用户重复行为模式挖掘的短序列推荐方法,其特征在于,所述步骤2)中重复行为模式序列R(S)通过如下方式获取:
给...

【专利技术属性】
技术研发人员:魏巍王子扬贲可荣何智勇马良荔彭付强黄园园
申请(专利权)人:中国人民解放军海军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1