基于图的可变形卷积序列推荐方法、系统、设备及介质技术方案

技术编号:37136514 阅读:12 留言:0更新日期:2023-04-06 21:36
本发明专利技术公开基于图的可变形卷积序列推荐方法、系统、设备及介质,涉及计算机应用领域,该方法包括:获取用户截止当前时刻感兴趣商品点击数据;对用户截止当前时刻感兴趣商品点击数据进行预处理,得到用户截止当前时刻感兴趣商品点击时序数据;将用户截止当前时刻感兴趣商品点击时序数据输入预训练的可变形卷积神经网络,得到感兴趣商品推荐结果;感兴趣商品推荐结果为下一时刻点击对象。本发明专利技术能够提高商品推荐的精确度,提高用户获取正确商品的效率。率。率。

【技术实现步骤摘要】
基于图的可变形卷积序列推荐方法、系统、设备及介质


[0001]本专利技术涉及计算机应用领域,特别是涉及一种基于图的可变形卷积序列推荐方法、系统、设备及介质。

技术介绍

[0002]推荐系统(RS)旨在了解用户的偏好并为用户选择有用的信息。随着数据的快速爆炸式增长,推荐系统对于缓解信息过载问题变得越来越重要。与将用户的一般偏好表示为静态模式的大多数现有RS不同,序列推荐系统(SRS)从用户的交互序列捕获动态依赖关系。为了更好地满足用户的需求,SRS近年来越来越受到关注。
[0003]为了捕捉顺序依赖,一些早期的方法,如FPMC引入马尔可夫链来捕获顺序模式。然后Fossil通过组合Matrix同时应长期和短期用户偏好,其本质是因式分解和马尔可夫链。然而,基于马尔可夫链的模型不能从序列中提取高阶依赖。最近,基于神经网络的方法已被用于对序列依赖进行建模,因其具有强大的表示能力。这些方法具有不同的网络结构,例如分别基于循环神经网络(RNN)、卷积神经网络(CNN)、注意力机制和图神经网络(GNN)的模型。
[0004]尽管现有的研究工作已经取得了优良的表现,但序列推荐仍然存在根本性的挑战。首先,由于大多数序列推荐模型主要使用用户

物品来学习用户的偏好,这些模型的性能依赖于充足历史交互数据。如今,随着在线服务的进一步普及,越来越多的平台需要面对没有足够历史数据的新用户,很难从只有几个历史数据的短序列中提取序列依赖关系并推断他们的偏好。因此,冷启动用户问题仍然是序列推荐所面临的根本挑战。此外,从序列中提取的偏好总是满足一些实际的用户特殊时期的需求。由于现实的多变性和用户意图的随机性,包含在序列中的这些偏好是难以提取。具体来说,复杂的序列依赖包括许多不同的模式,例如点级、联合级和跳级模式。同时,不同类型的物品对于预测有不同的贡献,有些物品甚至是干扰下一点击行为预测的噪声。
[0005]随着数据的快速爆炸式增长,推荐系统对于缓解信息过载问题变得越来越重要。序列推荐在于从用户中捕获用户动态的序列依赖关系。如今,随着在线服务的进一步普及,越来越多的平台需要面对没有足够历史数据的新用户,针对此类用户,很难从只有几个历史数据的短序列中提取序列依赖关系并推断他们的偏好,从而导致对此类用户进行商品推荐的精确度下降,用户获得正确感兴趣商品的效率低下,增加了时间成本。此外,从序列中提取的偏好总是满足一些实际的用户特殊时期的需求。由于现实的多变性和用户意图的随机性,包含在序列中的这些偏好是难以提取的。

技术实现思路

[0006]本专利技术的目的是提供一种基于图的可变形卷积序列推荐方法、系统、设备及介质,能够提高商品推荐的精确度以及提高了用户获得正确商品的效率。
[0007]为实现上述目的,本专利技术提供了如下方案:
[0008]一种基于图的可变形卷积序列推荐方法,所述方法包括:
[0009]获取用户截止当前时刻感兴趣商品点击数据;
[0010]对所述用户截止当前时刻感兴趣商品点击数据进行预处理,得到用户截止当前时刻感兴趣商品点击时序数据;
[0011]将所述用户截止当前时刻感兴趣商品点击时序数据输入预训练的可变形卷积神经网络,得到感兴趣商品推荐结果;所述感兴趣商品推荐结果为下一时刻点击对象;
[0012]其中,所述预训练的可变形卷积神经网络是通过样本数据集对可变形卷积神经网络进行训练得到的;所述样本训练集为用户历史感兴趣商品点击数据对应的历史时序数据和所述时序数据对应的下一时刻的点击对象;所述用户历史感兴趣商品点击数据对应的历史时序数据包括热启动用户时序数据和补全后的冷启动用户时序数据;所述补全后的冷启动用户时序数据为根据所述热启动用户时序数据对冷启动用户时序数据应用插值算法得到的;所述可变形卷积神经网络根据当前输入得到的卷积核偏差生成卷积内核。
[0013]可选地,所述预训练的可变形卷积神经网络的训练过程,具体包括:
[0014]获取用户历史感兴趣商品点击数据;
[0015]对所述用户历史感兴趣商品点击数据进行预处理,得到时序数据和所述时序数据对应的下一时刻的点击对象;所述时序数据包括长序列时序数据和短序列时序数据;所述长序列时序数据的长度大于等于预设阈值;所述短序列时序数据的长度小于所述预设阈值;
[0016]根据所述长序列时序数据,构建全局图;所述全局图的节点对应点击对象;所述全局图的边对应点击所述点击对象后的下一个点击对象;
[0017]将所述全局图输入图神经网络,得到所述全局图的节点表示;
[0018]根据所述节点表示,确定核心兴趣点;
[0019]根据所述核心兴趣点,应用插值算法对所述短序列时序数据进行插值,得到补全短序列时序数据;所述补全短序列时序数据的长度大于等于所述预设阈值;
[0020]将所述长序列时序数据和所述补全短序列时序数据输入可变形卷积神经网络,得到预测点击对象;
[0021]根据所述预测点击对象和所述时序数据对应的下一时刻的点击对象,得到Loss函数;
[0022]根据所述Loss函数对所述可变形卷积神经网络进行反向传播和梯度更新,得到预训练的可变形卷积神经网络。
[0023]可选地,所述可变形卷积神经网络为:
[0024]DepthwiseConv(E,w
i
,i)=w
i
*E
i

k+1:i
[0025][0026][0027][0028]其中,linear(*)是线性层,Δp∈R1×
2k
是由当前输入映射而成的卷积核偏差,W
ori
∈R
l
×
l
是用来生成最终卷积核的原始卷积空间,是根据β从原始卷积空间α获取最终
卷积核的过程,是输入信息的向量表示,l表示的是卷积偏差最大范围,i表示的是向量的第i维,k代表的是卷积核的大小,p0是离散的原始卷积域,i

k+1:i为卷积过程卷积核运算的范围变化从i

k+1到i,w
i
∈R
(n

1)
×
k
是最终的卷积核。
[0029]可选地,所述对所述用户历史感兴趣商品点击数据进行预处理,得到时序数据和所述时序数据对应的下一时刻的点击对象,具体包括:
[0030]将所述用户历史感兴趣商品点击数据按照ID进行划分;
[0031]将划分后的所述用户历史感兴趣商品点击数据按照时间戳进行升序排列,得到初始时序数据;
[0032]对所述初始时序数据中的重复点击数据进行合并,得到时序数据和所述时序数据对应的下一时刻的点击对象;
[0033]当所述短序列时序数据的数量等于0时,删除所述长序列时序数据中的数据,得到长度小于所述预设阈值的短序列时序数据;所述长序列时序数据和所述短序列时序数据的数量均大于0。
[0034]可选地,所述根据所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图的可变形卷积序列推荐方法,其特征在于,所述方法包括:获取用户截止当前时刻感兴趣商品点击数据;对所述用户截止当前时刻感兴趣商品点击数据进行预处理,得到用户截止当前时刻感兴趣商品点击时序数据;将所述用户截止当前时刻感兴趣商品点击时序数据输入预训练的可变形卷积神经网络,得到感兴趣商品推荐结果;所述感兴趣商品推荐结果为下一时刻点击对象;其中,所述预训练的可变形卷积神经网络是通过样本数据集对可变形卷积神经网络进行训练得到的;所述样本训练集为用户历史感兴趣商品点击数据对应的历史时序数据和所述时序数据对应的下一时刻的点击对象;所述用户历史感兴趣商品点击数据对应的历史时序数据包括热启动用户时序数据和补全后的冷启动用户时序数据;所述补全后的冷启动用户时序数据为根据所述热启动用户时序数据对冷启动用户时序数据应用插值算法得到的;所述可变形卷积神经网络根据当前输入得到的卷积核偏差生成卷积内核。2.根据权利要求1所述的基于图的可变形卷积序列推荐方法,其特征在于,所述预训练的可变形卷积神经网络的训练过程,具体包括:获取用户历史感兴趣商品点击数据;对所述用户历史感兴趣商品点击数据进行预处理,得到时序数据和所述时序数据对应的下一时刻的点击对象;所述时序数据包括长序列时序数据和短序列时序数据;所述长序列时序数据的长度大于等于预设阈值;所述短序列时序数据的长度小于所述预设阈值;根据所述长序列时序数据,构建全局图;所述全局图的节点对应点击对象;所述全局图的边对应点击所述点击对象后的下一个点击对象;将所述全局图输入图神经网络,得到所述全局图的节点表示;根据所述节点表示,确定核心兴趣点;根据所述核心兴趣点,应用插值算法对所述短序列时序数据进行插值,得到补全短序列时序数据;所述补全短序列时序数据的长度大于等于所述预设阈值;将所述长序列时序数据和所述补全短序列时序数据输入可变形卷积神经网络,得到预测点击对象;根据所述预测点击对象和所述时序数据对应的下一时刻的点击对象,得到Loss函数;根据所述Loss函数对所述可变形卷积神经网络进行反向传播和梯度更新,得到预训练的可变形卷积神经网络。3.根据权利要求2所述的基于图的可变形卷积序列推荐方法,其特征在于,所述可变形卷积神经网络为:DepthwiseConv(E,w
i
,i)=w
i
*E
i

k+1:ik+1:ik+1:i
其中,linear(*)是线性层,Δp∈R1×
2k
是由当前输入映射而成的卷积核偏差,W
ori
∈R
l
×
l
是用来生成最终卷积核的原始卷积空间,是根据β从原始卷积空间α获取最终卷积核的过程,是输入信息的向量表示,l表示的是卷积偏差最大范围,i表示的是向量的第i维,k代表的是卷积核的大小,p0是离散的原始卷积域,i

k+1:i为卷积过程卷积核运算的范围变化从i

k+1到i,w
i
∈R
...

【专利技术属性】
技术研发人员:李博涵臧亚磊马维华吴佳骏历傲然王雅妮玄鸿锐尹海莲文浩王学良
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1