通过对时序时间相关性建模的会话表示学习方法技术

技术编号：26791101 阅读：19 留言：0更新日期：2020-12-22 17:06

本发明专利技术公开了一种通过对时序时间相关性建模的会话表示学习方法，包括以下步骤：利用会话的时序特性，如项目特征、项目之间的位置特征、会话的长度特征，获取会话之中各个项目的融合系数；在会话级别上，整体归一化融合系数，之后利用归一化的融合系数融合会话中所有的项目，生成最终的会话表示；会话表示通过一个分类器进行预测。本发明专利技术对序列中时序相关性建模来学习会话表示，充分考虑了不同时序特性对于会话表示的贡献，可以获得更高的预测结果。

全部详细技术资料下载

【技术实现步骤摘要】
通过对时序时间相关性建模的会话表示学习方法
本专利技术涉及会话推荐
，具体涉及一种通过对时序时间相关性建模的会话表示学习方法。
技术介绍
互联网的诞生催生了海量数据，这让人们难以选择有用的信息。会话推荐是一种短期推荐，通常不跟踪用户ID，仅使用短期历史记录进行推荐。由于许多平台都支持匿名访问，因此这种情况已在社交平台上广泛出现。当会话关闭时，平台将丢失匿名用户的身份。因此，关键是要利用现有会话之间的相似行为，估计用户兴趣并预测其后续行为。协同过滤是推荐系统中经典的算法之一，该算法通过用户和项目之间的交互记录来分析用户的兴趣并做出预测。协同过滤也可以在会话推荐中使用。较为常见的是Item-KNN方法。Item-KNN根据项目之间的相似性做出预测，这种方法通常仅考虑会话中用户最后一次与之交互的项目，而忽略历史交互项目对当前预测的影响。Session-KNN基于会话之间的相似性做出预测，通常会考虑整个会话序列，但不考虑会话中项目的时序关系。矩阵分解也是推荐系统中的经典算法，它将用户与项目之间的交互矩阵分解为用户与项目...

【技术保护点】
1.一种通过对时序时间相关性建模的会话表示学习方法，其特征在于，包括以下步骤：/n步骤1，项目影响系数学习：根据会话序列的当前项目、最后项目、项目位置、会话长度共同学习项目影响系数并进行归一化；/n步骤2，会话表示学习：利用学习好的项目影响系数融合会话中所有的项目，得到最终的会话表示；/n步骤3，构建一个多分类的分类器，获得会话的预测概率。/n

【技术特征摘要】
1.一种通过对时序时间相关性建模的会话表示学习方法，其特征在于，包括以下步骤：
步骤1，项目影响系数学习：根据会话序列的当前项目、最后项目、项目位置、会话长度共同学习项目影响系数并进行归一化；
步骤2，会话表示学习：利用学习好的项目影响系数融合会话中所有的项目，得到最终的会话表示；
步骤3，构建一个多分类的分类器，获得会话的预测概率。

2.根据权利要求1所述的通过对时序时间相关性建模的会话表示学习方法，其特征在于，项目影响系数学习的具体方法如下：
已知会话点击过的项目序列，项目以索引号的形式给出；项目的其他信息和用户信息均为未知；由I＝{i1，i2，...，in}代表由n个项目组成的集合，∑＝{s1，s2，...，sm}表示由m个会话组成的集合；包含着b个项目的会话∑a即为，∑a＝[ia，1，ia，2，...，ia，b]，其中ia，j∈I；需要预测会话∑a下一个可能交互的项目的概率排序预测概率生成推荐列表从而进行top-k推荐；
设有一个包含k个项目的会话序列，∑1＝[i1，i2，...，ik]，其中ij∈I；
会话中除去最后一项的项目影响系数向量的公式如下：

对于序列∑1，上述公式可以计算项目ia的影响系数向量；cp表示除最后一项之外的其他项目的影响系数向量，其中cp∈RD，D是项目的嵌入维度；表示项目ia的影响系数向量；Mx，Ml，Mp，Me是四个影响系数矩阵，ia，ik，k-1，k分别表示项目a的索引号，项目k的索引号，项目a和项目k之间的距离，会话的长度；bx，bl，bp，be代表相应的偏置参数，其中bx∈RD，bl∈RD，bp∈RD，be∈RD；σ表示非线性激活函数；
Mx为项目自身影响系数矩阵，表示项目本身对影响系数的影响；Mx是一个从项目索引号到系数向量的映射集，包含着所有项目的系数向量；Mx∈RN×D，其中N表示项目的数量；
Ml为会话最后一项影响系数矩阵，表示会话序列中最后一项项目对影响系数的影响；Ml是一个从项目索引号到系数向量的映射集，包含着所有项目的系数向量；Ml∈RN×D；
Mp为会话项目位置影响系数矩阵，表示会话序列中任意一个项目与最后项目的距离对影响系数的影响；Mp是一个从距离到系数向量的映射集，包含着数据集中所有距离的系数向量；Mp∈R(ma...

【专利技术属性】
技术研发人员：李泽超，闫昭，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人