基于深层次网络嵌入特征的社会化信息推荐算法及系统技术方案

技术编号:19060305 阅读:25 留言:0更新日期:2018-09-29 12:51
本发明专利技术公开了一种基于深层次网络嵌入特征的社会化信息推荐算法及系统,预先在用户的社交网络上训练出一个网络嵌入模型,以提取用户的网络特征表示,再将提取的网络特征融入到矩阵分解模型中,利用最终生成的模型进行评分预测和项目推荐。本发明专利技术不仅可以深入利用社交网络信息,还可以利用协同过滤模型进行推荐;还同时具有较好的信息推荐准确率和收敛性。

【技术实现步骤摘要】
基于深层次网络嵌入特征的社会化信息推荐算法及系统
本专利技术涉及一种基于深层次网络嵌入特征的社会化信息推荐算法及系统。
技术介绍
计算机技术的快速发展在为用户提供便捷通信方式的同时,也使用户处于信息过载的困境。如何帮助用户从大量数据中获取有价值的信息已成为亟待解决的问题。推荐系统作为有效的信息过滤技术之一,近年来引起了很多关注。传统的推荐系统利用基于矩阵分解(MF)的协同过滤模型对用户的行为进行建模,例如,Koren等人在NetflixPrize竞赛中使用基于MF的方法,并取得比传统最近邻技术更好的性能。Salakhutdinov等进一步推导了MF的概率形式,并证明了基于MF的方法在稀疏的大数据集中也可以很好地运作。然而,上述传统方法仅利用用户-项目评分矩阵进行推荐,忽略了对用户的行为具有重要意义的社交关系(例如,朋友,信任关系)。在真实生活中,用户在决策时更有可能向朋友寻求建议。因此,近年来如何利用社会信息来提高推荐性能已被广泛研究。例如,Mohsen等人将信任传播机制纳入MF模型中以预测用户的行为。然而,这些已有的研究大多将社会关系给用户带来的影响作为目标函数的正则项加以考虑,社会网络的深层结构信息尚未得到充分探索。
技术实现思路
本专利技术为了解决上述问题,提出了一种基于深层次网络嵌入特征的社会化信息推荐算法及系统,本专利技术不仅可以利用协同过滤技术的优势保证推荐的准确性,还可以深入利用社交网络信息进一步增强推荐的性能。为了实现上述目的,本专利技术采用如下技术方案:一种基于深层次网络嵌入特征的社会化信息推荐算法,预先在用户的社交网络上训练出一个网络嵌入模型,以提取用户的网络特征表示,再将提取的网络特征与矩阵分解模型相融合,利用最终生成的模型进行评分预测和项目推荐。具体包括以下步骤:构建用户之间的社交关系网络;对用户之间的社交关系网络,使用node2vec算法,训练得出网络嵌入模型以提取用户的网络特征表示;利用基于矩阵分解的协同过滤模型来处理评分矩阵,从中学习用户和项目的潜在特征;将提取的网络特征与通过矩阵分解得到的潜在特征相结合,生成目标函数;对目标函数进行优化处理,得到最终的用户和项目的潜在特征矩阵及嵌入特征的权重矩阵;根据最终的用户和项目的潜在特征矩阵、嵌入特征的权重矩阵和预先训练的用户嵌入特征矩阵,生成预测的评分矩阵。构建用户之间的社交关系网络:社交网络由Guu=(U,Euu)表示,它可以反映用户之间的社交联系。U是用户集合,Euu是边集。对于任意两个用户,如果用户up与用户um具有社交联系(如信任关系和朋友关系),则顶点up和um之间会有一条边epm∈Euu,否则这条边不存在。对用户之间的社交关系网络,使用node2vec算法,训练得出网络嵌入模型以提取用户的网络特征表示,提取过程分为以下3步:根据用户社交网络,定义每个节点随机游走规则;根据规则对网络进行随机游走,保存游走记录;求得游走记录的最大似然函数,得到每个用户节点的网络嵌入特征。具体的,上述过程细节包括:步骤2-1:定义每个节点的随机游走规则:假设初始节点为t,现在随机游走到节点v,则下一步从节点v出发,会游走到v的其中一个邻居节点v’∈{t,x1,x2,x3},游走概率πvv'定义为:其中,dt,v'指的是网络中节点t与节点v’的最短路径长度,p是控制随机游走返回到上一节点的常数,q是控制随机游走选择深度遍历或广度遍历的常数,αpq(t,v')是一个在界定了dt,v'值后的一个关于p、q的分段函数。步骤2-2:根据规则对网络进行随机游走,保存游走记录:根据随机游走规则,得到网络G'uu=(U,Euu,π),对网络G'uu中的所有节点进行概率为π,步长为l的随机游走,每次将游走记录放入walk列表中,设定循环次数。步骤2-3:求得游走记录的最大似然函数,得到每个用户节点的网络嵌入特征:针对walk列表中的所有节点,采用随机梯度下降法最优化函数T为walk列表的长度,c为窗口大小,最终得到每个用户节点的网络嵌入特征d为特征维数,代表d维实数向量。利用基于矩阵分解的协同过滤模型来处理评分矩阵,从中学习用户和项目的潜在特征:令U={u1...uM}表示用户集合,I={i1...iN}表示项目集合,R=[Ru,i]M×N表示用户-项目评分矩阵,其中Ru,i代表用户u对项目i的评分。矩阵分解方法通过寻求k阶因子的乘积来近似表示评分矩阵R,即用户u对项目i的预测评分可表示为:其中U和I分别是用户和项目的潜在特征矩阵,列向量和分别表示特定用户u和特定项目i的特征向量,k为潜在特征维数。确定合适的潜在特征维度,以正确反馈出学习到的用户和项目的信息量,降低测试误差。优选的,潜在特征维度为15-20。将提取的网络特征与通过矩阵分解得到的潜在特征相结合,生成目标函数:由node2vec生成的用户网络嵌入特征表示从社交网络中学习的用户u的特征向量,意味着用户在社交网络Guu中受其朋友的影响程度。将其与矩阵分解得到的用户和项目的潜在特征通过线性方式相加,得到用户u对项目i的预测分数为通过使用平方损失函数,并添加防止过拟合的正则化项,得到最终的目标函数λU为用户的正则化参数,λI为项目的正则化参数,λW为权重的正则化参数,Ru,i为用户u对项目i的评分,k是用户和项目的潜在特征维数,u为目标用户,T为转置运算,如UuT表示用户u的潜在特征向量的转置,F是Frobenius范数。对目标函数进行优化处理,得到最终的用户和项目的潜在特征矩阵及嵌入特征的权重矩阵:分别固定用户、项目的潜在特征向量或嵌入特征的权重向量,使目标函数转换为二次方程最优化问题,运用梯度下降法进行优化处理,分别求出对用户、项目的潜在特征向量及权重向量的梯度,在给定用户和项目初始的潜在特征矩阵及预先训练的用户嵌入特征矩阵后,通过迭代训练模型,不断更新用户、项目的潜在特征矩阵以及权重矩阵,得到最终满足条件的潜在特征矩阵和权重矩阵。根据最终的用户和项目的潜在特征矩阵、嵌入特征的权重矩阵和预先训练的用户嵌入特征矩阵,生成预测的评分矩阵:将更新后的潜在因子相乘并与嵌入特征部分相加,得到最终的输出结果。一种基于深层次网络嵌入特征的社会化信息推荐系统,运行于处理器上,被配置为执行以下指令:预先在用户的社交网络上训练出一个网络嵌入模型,以提取用户的网络特征表示,再将提取的网络特征与矩阵分解模型相融合,利用最终生成的模型进行评分预测和项目推荐。与现有技术相比,本专利技术的有益效果为:1、本专利技术不仅可以深入利用社交网络信息,还可以利用协同过滤模型进行推荐;2、本专利技术具有较好的信息推荐准确率和收敛性。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1(a)和图1(b)为数据集Ciao上参数k对(a)RMSE和(b)MAE的影响示意图;图2(a)和图2(b)为数据集Epinions上参数k对(a)RMSE和(b)MAE结果的影响示意图;图3(a)和图3(b)为Ciao数据集上的收敛性结果示意图;图4(a)和图4(b)为Epinions数据集上的收敛性结果示意图;图5为本专利技术的具体流程图。具体实施方式:下面结合附图与实施例对本专利技术作进本文档来自技高网...

【技术保护点】
1.一种基于深层次网络嵌入特征的社会化信息推荐算法,其特征是:预先在用户的社交网络上训练出一个网络嵌入模型,以提取用户的网络特征表示,再将提取的网络特征与矩阵分解模型相结合,利用最终生成的模型进行评分预测和项目推荐。

【技术特征摘要】
1.一种基于深层次网络嵌入特征的社会化信息推荐算法,其特征是:预先在用户的社交网络上训练出一个网络嵌入模型,以提取用户的网络特征表示,再将提取的网络特征与矩阵分解模型相结合,利用最终生成的模型进行评分预测和项目推荐。2.一种基于深层次网络嵌入特征的社会化信息推荐算法,其特征是:包括以下步骤:构建用户之间的社交关系网络;对用户之间的社交关系网络,使用node2vec算法,训练得出网络嵌入模型以提取用户的网络特征表示;利用基于矩阵分解的协同过滤模型来处理评分矩阵,从中学习用户和项目的潜在特征;将提取的网络特征与通过矩阵分解得到的潜在特征相结合,生成目标函数;对目标函数进行优化处理,得到最终的用户和项目的潜在特征矩阵及嵌入特征的权重矩阵;根据最终的用户和项目的潜在特征矩阵、嵌入特征的权重矩阵和预先训练的用户嵌入特征矩阵,生成预测的评分矩阵。3.如权利要求2所述的一种基于深层次网络嵌入特征的社会化信息推荐算法,其特征是:构建用户之间的社交关系网络:社交网络由Guu=(U,Euu)表示,反映用户之间的社交联系,U是用户集合,Euu是边集,对于任意两个用户,如果用户up与用户um具有社交联系,则顶点up和um之间会有一条边epm∈Euu,否则这条边不存在。4.如权利要求2所述的一种基于深层次网络嵌入特征的社会化信息推荐算法,其特征是:对用户之间的社交关系网络,使用node2vec算法,训练得出网络嵌入模型以提取用户的网络特征表示,根据用户社交网络,定义每个节点随机游走规则;根据规则对网络进行随机游走,保存游走记录;求得游走记录的最大似然函数,得到每个用户节点的网络嵌入特征。5.如权利要求4所述的一种基于深层次网络嵌入特征的社会化信息推荐算法,其特征是:定义每个节点的随机游走规则中,假设上一时刻在节点t,现在随机游走到节点v,则下一步从节点v出发,会游走到v的其中一个邻居节点v’∈{t,x1,x2,x3},游走概率πvv’定义为:其中,dt,v'指的是网络中节点t与节点v’的最短路径长度,p是控制随机游走返回到上一节点的常数,q是控制随机游走选择深度遍历或广度遍历的常数。6.如权利要求4所述的一种基于深层次...

【专利技术属性】
技术研发人员:郭磊温宇菲王新华刘方爱
申请(专利权)人:山东师范大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1