一种图网络冷启动推荐方法技术

技术编号:28420324 阅读:14 留言:0更新日期:2021-05-11 18:27
本发明专利技术公开了一种图网络冷启动推荐方法,包括:将预打分的用户‑物品数据输入至训练后的图网络,得到推荐结果;训练包括:获取待训练的节点集或局部子图的采样局部图;对采样局部图进行距离重标记得到重标记标签;将采样局部图的节点分配初始特征;获取初始特征的预测标签和预测评分;利用预测标签和重标记标签计算节点分类误差,利用预测评分和物品‑用户的真实评分计算评分预测误差;利用节点分类误差和评分预测误差计算得到整体误差,利用整体误差对图网络的参数进行更新。本发明专利技术通过局部图采样和双任务学习,在推导式图推理任务的基础上进一步实现了归纳式节点推理和连接预测能力,具备对图外节点的特征表示能力。

【技术实现步骤摘要】
一种图网络冷启动推荐方法
本专利技术涉及信息
,尤其涉及一种图网络冷启动推荐方法。
技术介绍
最近几年,随着图网络的兴起,一系列基于图网络的算法应运而生。其中,由于推荐系统中数据格式与图网络结构的天生契合性,将图网络应用到推荐领域成了众多研究者的首要目标。其中,以GC-MC作为代表性的模型在推荐领域验证数据集上取得了极为优异的表现。然而,这类图网络推荐算法的一个显著问题在于其并不能有效地应对推荐环境中冷启动与稀疏标签性问题。其深层原因在于这些方法其本质上属于推导式(transductive)算法,只能在一个整体图中进行特征学习,对于图外节点并没有推理和特征传递的能力,例如在GC-MC中由于需要使用独热编码作为节点的初始特征,这使得特征的维度被固定住了,如果存在新增加的节点,该方法几乎没有办法为其分配合适的初始特征。从推荐系统层面上讲,基于这类算法的方法便无法实现对处于用户增长期的系统或平台提供有效的服务,需要大量地进行模型训练以匹配实时的用户容量。此外,由于现有的诸多方法需要对整个交互矩阵进行建模存储,当用户、物品数量增长到一定规模后,其对存储空间的要求也成倍数的增加,这对存储介质和设备带来了不小的挑战。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种图网络冷启动推荐方法。本专利技术的目的是通过以下技术方案来实现的:本专利技术的第一方面,提供一种图网络冷启动推荐方法,包括以下步骤:将预打分的用户-物品数据输入至训练后的图网络,得到推荐结果;所述图网络的训练包括以下子步骤:获取待训练的节点集或局部子图的采样局部图,所述采样局部图中的节点包括用户节点和物品节点;对采样局部图进行距离重标记得到重标记标签,其中物品节点和用户节点的重标记规则不同;将采样局部图的节点分配初始特征;获取初始特征的预测标签和预测评分;利用预测标签和重标记标签计算节点分类误差,利用预测评分和物品-用户的真实评分计算评分预测误差;利用节点分类误差和评分预测误差计算得到整体误差,利用整体误差对图网络的参数进行更新。进一步地,所述获取待训练的节点集或局部子图的采样局部图,包括:获取推荐系统中用户-物品交互信息矩阵M;矩阵大小为nu×nv,nu为用户总数,nv为物品总数,M中第i行第j列的值rij为用户ui对物品vj的评分,0代表没有交互;通过交互矩阵构建用户-物品交互图G;交互评分的值限定在评分集合R;从用户集合U与物品集合V中随机选取q个节点,q∈[2,Q],Q为预设常数,并确保q个节点有若干评分交互;该q个节点组成初始节点集或局部子图N;对N中的节点在G中向外扩展K跳邻域进行初始采样,即将N中节点0至K跳所能到达的节点均进行采样,所有采样的节点组成局部图进一步地,所述获取待训练的节点集或局部子图的采样局部图,还包括:设定局部图最大规模Qmax,当所述初始采样完成后判断节点个数,当多于Qmax,则从图边界进行额外删减,保留下的所有采样的节点组成局部图进一步地,所述对采样局部图进行距离重标记得到重标记标签,包括:设置用户节点ui的标签为ui与N的距离值的两倍,物品节点vj的标签为vj与N的距离值的两倍加一;为每一个节点生成真实标签向量pi即重标记标签,i表示中第i个节点。进一步地,所述将采样局部图的节点分配初始特征,包括:对中的节点分配初始特征,节点ui特征向量设定规则为:其中,为ui在中的独热编码,[;]表示向量级联操作;在存在用户物品描述信息时,为ui的定长描述特征,通过对原始特征变换得到;当系统为匿名推荐系统,不存在描述字段时,为空;同理,中所有节点特征组成初始特征矩阵x0。进一步地,所述获取初始特征的预测标签和预测评分;利用预测标签和重标记标签计算节点分类误差,利用预测评分和物品-用户的真实评分计算评分预测误差;具体包括:将x0输入到图编码网络GE中,设定GE有L层,第l层GNN的输出特征为El,l∈[1,L];通过l层网络消息传递与聚合,计算最终局部图嵌入特征,取的嵌入特征矩阵从中提取局部子图N的节点嵌入EN;输入到图分类器GC,预测中第i个点的预测标签计算与pi的节点分类误差输入EN到双线性编码器BD,预测N中边的交互预测评分计算与rij的计算评分预测误差进一步地,所述图编码网络GE为R-GCN或GVAE;当采用GVAE时,具体实现包括:设定GVAE有L层,第l层r边类型的参数矩阵为则在当前层节点j对节点i在的r类边的消息传递可表示为:其中表示节点i的r类邻居个数,表示节点j在l层的输入特征(若为第1层则为节点j的初始特征);在进行所有类边的消息传递后,第l层节点i的隐向量的聚合表示为:stack()表示向量级联操作,σ(·)表示非线性激活函数;为了得到节点的最终表示,在得到所有层的隐向量后执行如下变换:其中We为可训练参数矩阵,concat(·)为矩阵拼接操作,ei为节点i经过l层聚合后的最终表示;中所有节点的聚合表示拼接为聚合特征矩阵之间采用顺序权重共享,具体而言,由一组矩阵求和得到:其中表示可训练参数矩阵,即参数由一系列具体的矩阵组合得到,随着r越大,包含的可训练参数量越多。进一步地,所述图分类器GC为GCN或MLP;当采用MLP时,具体实现包括:节点的预测标签通过以下公式计算得到:其中Wp为可训练参数矩阵,wT为可训练参数向量;得到预测标签后,计算与pi的节点分类误差具体而言,由下列公式计算得到:其中,F表示预测向量的维度(向量长度)。进一步地,所述双线性编码器BD的具体实现包括:首先计算每一类评分的概率,表示为指数双线性运算:其中,表示评分矩阵中第i行第j列的评分为r的概率,Qr表示可训练参数矩阵;然后计算评分期望在得到后由下列式计算评分预测误差其中当r=rij时I[r=rij]=1,否则I[r=rij]=0。进一步地,所述利用整体误差对图网络的参数进行更新包括:利用整体误差,对图编码网络GE、图分类器GC、双线性编码器BD进行误差反向传播。本专利技术的第二方面,提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述的一种图网络冷启动推荐方法的步骤。本专利技术的第三方面,提供一种装置,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述的一种图网络冷启动推荐方法的步骤。本专利技术的有益效果是:(1)在本专利技术的一示例性实施例中,通过局部图采样和双任务学习,在推导式图推理任务的基础上进一步实现了归纳式节点推理和连接预测能力,具备对图外节点的特征表示能力。同时本示例性实施例提供了一种应对冷启动问题的推荐算法和实施部署方法,有效应对了本文档来自技高网...

【技术保护点】
1.一种图网络冷启动推荐方法,其特征在于:包括以下步骤:/n将预打分的用户-物品数据输入至训练后的图网络,得到推荐结果;所述图网络的训练包括以下子步骤:/n获取待训练的节点集或局部子图的采样局部图,所述采样局部图中的节点包括用户节点和物品节点;/n对采样局部图进行距离重标记得到重标记标签,其中物品节点和用户节点的重标记规则不同;/n将采样局部图的节点分配初始特征;/n获取初始特征的预测标签和预测评分;/n利用预测标签和重标记标签计算节点分类误差,利用预测评分和物品-用户的真实评分计算评分预测误差;/n利用节点分类误差和评分预测误差计算得到整体误差,利用整体误差对图网络的参数进行更新。/n

【技术特征摘要】
1.一种图网络冷启动推荐方法,其特征在于:包括以下步骤:
将预打分的用户-物品数据输入至训练后的图网络,得到推荐结果;所述图网络的训练包括以下子步骤:
获取待训练的节点集或局部子图的采样局部图,所述采样局部图中的节点包括用户节点和物品节点;
对采样局部图进行距离重标记得到重标记标签,其中物品节点和用户节点的重标记规则不同;
将采样局部图的节点分配初始特征;
获取初始特征的预测标签和预测评分;
利用预测标签和重标记标签计算节点分类误差,利用预测评分和物品-用户的真实评分计算评分预测误差;
利用节点分类误差和评分预测误差计算得到整体误差,利用整体误差对图网络的参数进行更新。


2.根据权利要求1所述的一种图网络冷启动推荐方法,其特征在于:所述获取待训练的节点集或局部子图的采样局部图,包括:
获取推荐系统中用户-物品交互信息矩阵M;矩阵大小为nu×nv,nu为用户总数,nv为物品总数,M中第i行第j列的值rij为用户ui对物品vj的评分,0代表没有交互;通过交互矩阵构建用户-物品交互图G;交互评分的值限定在评分集合R;
从用户集合U与物品集合V中随机选取q个节点,q∈[2,Q],Q为预设常数,并确保q个节点有若干评分交互;该q个节点组成初始节点集或局部子图N;
对N中的节点在G中向外扩展K跳邻域进行初始采样,即将N中节点0至K跳所能到达的节点均进行采样,所有采样的节点组成局部图


3.根据权利要求2所述的一种图网络冷启动推荐方法,其特征在于:所述获取待训练的节点集或局部子图的采样局部图,还包括:
设定局部图最大规模Qmax,当所述初始采样完成后判断节点个数,当多于Qmax,则从图边界进行额外删减,保留下的所有采样的节点组成局部图


4.根据权利要求2所述的一种图网络冷启动推荐方法,其特征在于:所述对采样局部图进行距离重标记得到重标记标签,包括:
设置用户节点ui的标签为ui与N的距离值的两倍,物品节点vj的标签为vj与N的距离值的两倍加一;为每一个节点生成真实标签向量pi即重标记标签,i表示中第i个节点。


5.根据权利要求4所述的一种图网络冷启动推荐方法,其特征在于:所述将采样局部图的节点分配初始特征,包括:
对中的节点分配初始特征,节点u特征向量设定规则为:其中,为ui在中的独热编码,[;]表示向量级联操作;在存在用户物品描述信息时,为ui的定长描述特征,通过对原始特征变换得到;当系统为匿名推荐系统,不存在描述字段时,为空;同理,中所有节点特征组成初始特征矩阵x0。


6.根据权利要求5所述的一种图网络冷启动推荐方法,其特征在于:所述获取初始特征的预测标签和预测评分;利用预测标签和重标记标签计算节点分类误差,利用预测评分和物品-...

【专利技术属性】
技术研发人员:匡平郑庭颖
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1