通过对时序时间相关性建模的会话表示学习方法技术

技术编号:26791101 阅读:17 留言:0更新日期:2020-12-22 17:06
本发明专利技术公开了一种通过对时序时间相关性建模的会话表示学习方法,包括以下步骤:利用会话的时序特性,如项目特征、项目之间的位置特征、会话的长度特征,获取会话之中各个项目的融合系数;在会话级别上,整体归一化融合系数,之后利用归一化的融合系数融合会话中所有的项目,生成最终的会话表示;会话表示通过一个分类器进行预测。本发明专利技术对序列中时序相关性建模来学习会话表示,充分考虑了不同时序特性对于会话表示的贡献,可以获得更高的预测结果。

【技术实现步骤摘要】
通过对时序时间相关性建模的会话表示学习方法
本专利技术涉及会话推荐
,具体涉及一种通过对时序时间相关性建模的会话表示学习方法。
技术介绍
互联网的诞生催生了海量数据,这让人们难以选择有用的信息。会话推荐是一种短期推荐,通常不跟踪用户ID,仅使用短期历史记录进行推荐。由于许多平台都支持匿名访问,因此这种情况已在社交平台上广泛出现。当会话关闭时,平台将丢失匿名用户的身份。因此,关键是要利用现有会话之间的相似行为,估计用户兴趣并预测其后续行为。协同过滤是推荐系统中经典的算法之一,该算法通过用户和项目之间的交互记录来分析用户的兴趣并做出预测。协同过滤也可以在会话推荐中使用。较为常见的是Item-KNN方法。Item-KNN根据项目之间的相似性做出预测,这种方法通常仅考虑会话中用户最后一次与之交互的项目,而忽略历史交互项目对当前预测的影响。Session-KNN基于会话之间的相似性做出预测,通常会考虑整个会话序列,但不考虑会话中项目的时序关系。矩阵分解也是推荐系统中的经典算法,它将用户与项目之间的交互矩阵分解为用户与项目的潜在因子矩阵,然后通过内部积进行预测。在会话推荐中,我们通常使用会话和项目之间的交互矩阵,而不是用户和项目之间的交互矩阵。由于会话并不完全等同于用户,因此在实践中,该方法的实用性将降低。后来,马尔可夫链应用于会话推荐中。马尔可夫链通常只能基于局部序列构造模型,而忽略序列的历史记录。近年来,随着深度学习的发展,基于神经网络的模型已广泛应用于各种任务之中。同样的,该模型也应用于会话推荐。由于会话固有的时序性质,一些工作尝试使用递归神经网络(RNN)解决此类推荐问题。GRU4REC首先将RNN应用于会话推荐,并取得了良好的效果。之后,一些工作尝试在GRU4REC的基础上进行改进,包括分层RNN,数据增强,融合注意力机制,融合邻居会话和融合图网络。这些方法本质上都是基于RNN的。经实践证明,RNN可以很好地解决序列推荐问题。但是,逐次融合项目的RNN策略,始终在寻找局部最优融合策略,很难找到长序列项目的最优融合方式。
技术实现思路
本专利技术的目的在于提供一种通过对时序时间相关性建模的会话表示学习方法,方法整体上采用前馈神经网络构建,通过大量的学习样本来学习网络中各个部分的参数。实现本专利技术目的的技术方案为:一种通过对时序时间相关性建模的会话表示学习方法,包括以下步骤:步骤1,项目影响系数学习:根据会话序列的当前项目、最后项目、项目位置、会话长度共同学习项目影响系数并进行归一化;步骤2,会话表示学习:利用学习好的项目影响系数融合会话中所有的项目,得到最终的会话表示;步骤3,构建一个多分类的分类器,获得会话的预测概率。本专利技术与现有技术相比,其显著优点为:(1)在获得项目的融合系数的过程中,本专利技术比其他方法多考虑了项目之间的相对位置和会话长度这两个会话特征;(2)本专利技术提出了一种向量级的融合系数来融合序列中的项目,这种方法能够充分考虑项目分量对于最终预测的影响;(3)本专利技术的方法可以整体考虑会话项目的融合方案,而不是像RNN一样需要逐次融合,这样能够更容易的找到最优融合策略。附图说明图1为本专利技术通过对时序时间相关性建模的会话表示学习方法的流程图。具体实施方式结合图1,本专利技术提出一种通过对时序时间相关性建模的会话表示学习方法,该方法用于解决会话推荐问题,会话推荐的定义是预测会话下一个可能被单击的项目;已知会话点击过的项目序列,项目以索引号的形式给出;项目的其他信息和用户信息均为未知;让I={i1,i2,...,in}代表由n个项目组成的集合,∑={s1,s2,...,sm}表示由m个会话组成的集合;包含着b个项目的会话∑a即为,∑a=[ia,1,ia,2,...,ia,b],其中ia,j∈I;需要预测会话∑a下一个可能交互的项目的概率排序预测概率生成推荐列表从而进行top-k推荐。本专利技术的具体步骤如下:步骤1,项目影响系数学习:根据会话序列的当前项目、最后项目、项目位置、会话长度共同学习项目影响系数并进行归一化;设有一个包含k个项目的会话序列,∑1=[i1,i2,...,ik],其中ij∈I。会话中除去最后一项的项目影响系数向量的公式如下:对于序列∑1,上述公式可以计算项目ia的影响系数向量;cp表示除最后一项之外的其他项目的影响系数向量,其中cp∈RD,D是项目的嵌入维度;表示项目ia的影响系数向量。Mx,Ml,Mp,Me是四个影响系数矩阵,我们将在后面详细介绍。ia,ik,k-1,k分别表示项目a的索引号,项目k的索引号,项目a和项目k之间的距离,会话的长度。bx,bl,bp,be代表相应的偏置参数,其中bx∈RD,bl∈RD,bp∈RD,be∈RD。σ表示非线性激活函数。Mx为项目自身影响系数矩阵,表示项目本身对影响系数的影响。Mx是一个从项目索引号到系数向量的映射集,包含着所有项目的系数向量。Mx∈RN×D,其中N表示项目的数量,D表示项目的嵌入维度。Mx是一个可学习的参数矩阵。Ml为会话最后一项影响系数矩阵,表示会话序列中最后一项项目对影响系数的影响。Ml是一个从项目索引号到系数向量的映射集,包含着所有项目的系数向量。Ml∈RN×D,其中N表示项目的数量,D表示项目的嵌入维度。Ml是一个可学习的参数矩阵。Mp为会话项目位置影响系数矩阵,表示会话序列中任意一个项目与最后项目的距离对影响系数的影响。Mp是一个从距离到系数向量的映射集,包含着数据集中所有距离的系数向量。Mp∈R(maxlen-1)×D,其中maxlen表示会话的最大长度,D表示项目的嵌入维度。Mp是一个可学习的参数矩阵。Me为会话长度影响系数矩阵,表示会话序列长度对影响系数的影响。Me是一个从长度到系数向量的映射集,包含着数据集中所有序列长度的系数向量。Me∈Rmaxlen×D,其中maxlen表示会话的最大长度,D表示项目的嵌入维度。Me是一个可学习的参数矩阵。会话中最后一项的项目影响系数向量的表达式如下:对于序列∑1,上述公式可以计算项目ik的影响系数向量,也就是会话最后一项项目的影响系数向量。cl表示最后一项的影响系数向量,其中cl∈RD,D是项目的嵌入维度。表示ik的影响系数向量。1D表示维度为D且每个分量都为1的向量。σ表示cp的非线性激活函数。影响系数的归一化公式如下:对于序列∑1,上述公式可以计算项目ix经过归一化的影响系数向量。ix表示序列中的任意项目。n表示经过归一化的影响系数向量,其中n∈RD,D表示是项目嵌入维度。步骤2,会话表示学习:利用学习好的项目影响系数融合会话中所有的项目,得到最终的会话表示;在会话推荐中,通常使用嵌入层把项目转化成一个高维稠密向量。这里本专利技术使用了同样的方法。嵌入层是一个前馈神经网络,它将项目的索引号投射到高维空间。会话表示公式如下:序列∑1的会话表示如本文档来自技高网
...

【技术保护点】
1.一种通过对时序时间相关性建模的会话表示学习方法,其特征在于,包括以下步骤:/n步骤1,项目影响系数学习:根据会话序列的当前项目、最后项目、项目位置、会话长度共同学习项目影响系数并进行归一化;/n步骤2,会话表示学习:利用学习好的项目影响系数融合会话中所有的项目,得到最终的会话表示;/n步骤3,构建一个多分类的分类器,获得会话的预测概率。/n

【技术特征摘要】
1.一种通过对时序时间相关性建模的会话表示学习方法,其特征在于,包括以下步骤:
步骤1,项目影响系数学习:根据会话序列的当前项目、最后项目、项目位置、会话长度共同学习项目影响系数并进行归一化;
步骤2,会话表示学习:利用学习好的项目影响系数融合会话中所有的项目,得到最终的会话表示;
步骤3,构建一个多分类的分类器,获得会话的预测概率。


2.根据权利要求1所述的通过对时序时间相关性建模的会话表示学习方法,其特征在于,项目影响系数学习的具体方法如下:
已知会话点击过的项目序列,项目以索引号的形式给出;项目的其他信息和用户信息均为未知;由I={i1,i2,...,in}代表由n个项目组成的集合,∑={s1,s2,...,sm}表示由m个会话组成的集合;包含着b个项目的会话∑a即为,∑a=[ia,1,ia,2,...,ia,b],其中ia,j∈I;需要预测会话∑a下一个可能交互的项目的概率排序预测概率生成推荐列表从而进行top-k推荐;
设有一个包含k个项目的会话序列,∑1=[i1,i2,...,ik],其中ij∈I;
会话中除去最后一项的项目影响系数向量的公式如下:



对于序列∑1,上述公式可以计算项目ia的影响系数向量;cp表示除最后一项之外的其他项目的影响系数向量,其中cp∈RD,D是项目的嵌入维度;表示项目ia的影响系数向量;Mx,Ml,Mp,Me是四个影响系数矩阵,ia,ik,k-1,k分别表示项目a的索引号,项目k的索引号,项目a和项目k之间的距离,会话的长度;bx,bl,bp,be代表相应的偏置参数,其中bx∈RD,bl∈RD,bp∈RD,be∈RD;σ表示非线性激活函数;
Mx为项目自身影响系数矩阵,表示项目本身对影响系数的影响;Mx是一个从项目索引号到系数向量的映射集,包含着所有项目的系数向量;Mx∈RN×D,其中N表示项目的数量;
Ml为会话最后一项影响系数矩阵,表示会话序列中最后一项项目对影响系数的影响;Ml是一个从项目索引号到系数向量的映射集,包含着所有项目的系数向量;Ml∈RN×D;
Mp为会话项目位置影响系数矩阵,表示会话序列中任意一个项目与最后项目的距离对影响系数的影响;Mp是一个从距离到系数向量的映射集,包含着数据集中所有距离的系数向量;Mp∈R(ma...

【专利技术属性】
技术研发人员:李泽超闫昭
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1