一种基于异构信息网络的个性化推荐方法技术

技术编号:22135358 阅读:24 留言:0更新日期:2019-09-18 09:03
本发明专利技术公开了一种基于异构信息网络的个性化推荐方法,本方法通过基于注意力的特征增强模块对不同元图上用户和物品潜在特征的重要性进行学习,降低了无用的潜在特征对评分预测所带来的干扰,增强了有用潜在特征对评分预测的贡献力;同时利用基于分层次特征交互的评分预测模块对特征间的不同相互关系进行学习,不但考虑用户和物品各自加权潜在特征之间的内在联系,而且考虑用户或物品与其加权潜在特征之间的相关性;然后通过用户和物品间特征的融合,使得各特征间的二阶线性交互关系得到了充分挖掘。本发明专利技术通过多层感知机和因子分解机的使用,使得各特征间的高阶非线性交互关系得到了全面利用和高效组合,大大提高了推荐系统的性能。

A Personalized Recommendation Method Based on Heterogeneous Information Network

【技术实现步骤摘要】
一种基于异构信息网络的个性化推荐方法
本专利技术涉及一种基于异构信息网络的个性化推荐方法,属于计算机软件

技术介绍
随着网络的迅速发展,网上的信息量大幅增长。如何在大量信息中准确获得对用户真正有用的那部分信息成为了一个重要的问题。推荐系统是一个非常有潜力的解决办法,它可以根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户。在推荐系统中,为了更加全面的获取多样化的信息,考虑到异构信息网络可以包含多类型的实体和关系,基于异构信息网络的推荐方法得到了越来越广泛的研究。现有的基于异构信息网络的推荐方法大致可分为两大类:基于元路径的推荐方法和基于元图的推荐方法。基于元路径的推荐方法通常是预定义一个元路径集合来生成实体之间的语义相关性,然后把他们看作潜在特征来进行推荐。例如,中国专利(公开号:CN103955535A)通过不同的元路径获取不同的语义信息,并利用基于异步双向随机游走的相关性计算方法来计算不同元路径下用户与物品之间的相关性,进而向用户推荐其可能感兴趣的物品。基于元图的推荐方法通过元图来生成两个实体之间复杂的相关性并能够捕捉到他们之间的复杂语义。例如,中国专利(公开号:CN103955535A)将异构信息网络划分为不同元图,利用各元图获取用户和物品的相似性矩阵,然后对相似性矩阵进行融合并构造评分方程。根据已知评分的样本对评分方程进行训练,从而预测用户对物品的评分并将评分符合预设条件的物品推荐给用户。该方法能有效解决现有技术使用元路径分析用户和物品相似性语义覆盖不全面的问题,充分考虑特征之间的关联性,从而为用户推荐有用的物品。由于基于元路径的推荐方法只能表示两种不同类型实体之间的简单关系,因此很难捕捉到实体之间的复杂语义,被忽略的那些有用信息在一定程度上对推荐结果的生成造成了影响,降低了推荐系统的准确率。基于元图的推荐方法大多是简单的不加选择的利用所有潜在特征来进行推荐。然而,对于评分预测来说,并不是所有的潜在特征都是有用的,那些无用的潜在特征不但不会对评分预测起到贡献作用,还有可能会引入一些噪音,降低推荐系统的性能。同时,这些方法通常利用因子分解机进行评分预测,而大多数因子分解机只对特征进行简单的二阶交互。由于所有的特征被以大致相同的方式进行建模,难以区分出不同层次的特征交互所发挥的不同作用,使得评分预测的结果并不理想。
技术实现思路
针对现有推荐方法的不足,本专利技术提出了一种新的基于异构信息网络的个性化推荐方法。该方法通过基于注意力的特征增强模块对不同元图上用户和物品潜在特征的重要性进行学习,降低了无用的潜在特征对评分预测所带来的干扰,增强了有用潜在特征对评分预测的贡献力。同时,该方法利用基于分层次特征交互的评分预测模块对特征间的不同相互关系进行学习,不但考虑用户和物品各自加权潜在特征之间的内在联系,而且考虑用户或物品与其加权潜在特征之间的相关性。同时,通过用户和物品间特征的融合,使得各特征间的二阶线性交互关系得到了充分挖掘。另外,多层感知机和因子分解机的使用,使得各特征间的高阶非线性交互关系得到了全面利用和高效组合,大大提高了推荐系统的性能。本专利技术提出的基于异构信息网络的个性化推荐方法,提供了一个完整的评分预测架构,主要由特征提取器、基于注意力的特征增强模块和基于分层次特征交互的评分预测模块组成。通过对评分预测模型的训练,特征提取器分别对用户和物品以查表的方式进行特征的表示学习,同时在不同的元图上利用邻接矩阵对用户和物品进行相似性计算并获取用户-物品相似度矩阵。然后,通过对用户-物品相似度矩阵进行矩阵因子分解得到不同元图上用户的潜在特征和物品的潜在特征。基于注意力的特征增强模块通过学习不同元图上用户和物品潜在特征的重要性,自动为有用的潜在特征生成较高的权重,为无用的潜在特征生成较低的权重,降低无用特征对评分预测所带来的干扰,同时增强有用特征对评分预测的贡献力,克服了现有技术中潜在特征区分力不强、重要特征对评分预测贡献性低的问题,提高了评分预测的准确度。同时,基于分层次特征交互的评分预测模块在特征增强的基础上充分利用特征间的不同相互关系,分别对用户和物品各自加权潜在特征之间的相关性、用户或物品和其加权潜在特征之间的相关性以及用户和物品之间的相关性进行充分挖掘,使得各特征间的交互关系得到了全面利用和高效组合,使得预测评分更接近真实评分,大大提高了推荐系统的性能。按照本专利技术所提供的设计方案,一种基于异构信息网络的个性化推荐方法,具体包含如下步骤:步骤1.数据预处理。将用户对物品的评分数据集分为训练集和测试集两部分,其中,每一条评分记录都有用户对物品的喜好程度打分,打分范围为1到5分,分值越高表明该用户对该物品越感兴趣;步骤2.构建评分预测架构。该架构包括特征提取器、基于注意力的特征增强模块和基于分层次特征交互的评分预测模块。特征提取器包括对用户的表示学习、对物品的表示学习以及不同元图上用户和物品的潜在特征提取。其中,潜在特征提取过程包括基于元图的用户-物品相似度计算和矩阵因子分解两部分。基于注意力的特征增强模块包含两个结构相似的网络,它们分别为用户注意力网络和物品注意力网络,各由两个全连接层组成。用户注意力网络的第一层公式为:第二层公式为其中表示第1个全连接层上基于第i个元图的权值矩阵,X表示用户的向量矩阵,U(i)表示第i个元图上所获取到的用户潜在特征,表示第1个全连接层上基于第i个元图的偏置向量,表示第2个全连接层上基于第i个元图的权值矩阵,表示第2个全连接层上基于第i个元图的偏置向量,RELU表示网络的激活函数,表示第1个全连接层上基于第i个元图所学习到的注意力权值矩阵,表示第2个全连接层上基于第i个元图所学习到的注意力权值矩阵。在获取到用户潜在特征的注意力权值矩阵后,为了将权值的范围统一到(0,1)内,我们使用softmax函数对其进行归一化处理,得到第i个元图上最终的注意力权值矩阵E(i)。注意力权值相对较高的用户潜在特征我们将其视为有用的潜在特征,注意力权值相对较低的用户潜在特征我们将其视为无用的潜在特征;将潜在特征与学习到的权值进行乘积操作,相对不重要的特征会与较小的权值(比如说0.01,0.001,0.003等)相乘,相对重要的特征会与较大的权值(比如说0.98,0.97等)相乘。通过这种方式我们可以对不同元图上生成的用户潜在特征进行重要性区分,从而降低无用潜在特征对评分预测所带来的干扰,同时增强有用潜在特征对评分预测的贡献力。同时,我们以相同的方式通过物品注意力网络对物品潜在特征的重要性进行区分。基于分层次特征交互的评分预测模块主要考虑三个层次的特征相关性挖掘,包括用户和物品各自加权潜在特征之间的内在联系、用户或物品与其加权潜在特征之间的相关性以及用户和物品之间的特征交互关系;步骤3.训练评分预测模型。将训练集中用户对物品的评分记录输入到特征提取器中,得到用户的表示向量、物品的表示向量以及不同元图上的潜在特征。将不同潜在特征输入到基于注意力的特征增强模块,学习得到各潜在特征的权值。将权值与潜在特征进行点乘操作,得到加权潜在特征。将加权潜在特征、用户的表示向量以及物品的表示向量输入基于分层次特征交互的评分预测模块进行评分预测。计算预测值与真实值之间的误差并更新网本文档来自技高网
...

【技术保护点】
1.一种基于异构信息网络的个性化推荐方法,其步骤包括:1)将用户对物品的评分数据集分为训练集和测试集;其中,评分数据集中的每一条评分记录包含用户对物品的喜好程度打分;构建评分预测架构,其包括特征提取器、基于注意力的特征增强模块和基于分层次特征交互的评分预测模块;其中,特征提取器用于生成用户的表示向量、物品的表示向量以及提取元图上用户和物品的潜在特征;基于注意力的特征增强模块包含用户注意力网络和物品注意力网络,用户注意力网络用于对用户的潜在特征的重要性进行区分;物品注意力网络用于对物品的潜在特征的重要性进行区分;基于分层次特征交互的评分预测模块用于特征相关性挖掘,包括用户各加权潜在特征之间的内在联系,物品各加权潜在特征之间的内在联系,用户与其加权潜在特征之间的相关性,物品与其加权潜在特征之间的相关性,以及用户和物品之间的特征交互关系;2)将训练集中用户对物品的评分记录输入到特征提取器中,得到用户的表示向量、物品的表示向量并提取元图上用户和物品的潜在特征;然后将不同潜在特征输入到基于注意力的特征增强模块,学习得到各潜在特征的权值,将权值与潜在特征进行点乘操作,得到加权潜在特征;然后将加权潜在特征、用户的表示向量以及物品的表示向量输入基于分层次特征交互的评分预测模块进行评分预测,然后根据预测值与真实值之间的误差更新网络参数,直到评分预测模型收敛且在测试集上的效果达到最优;3)将测试集中用户的ID和待评分物品的ID输入到步骤2)训练得到的评分预测模型中,得到各用户对每一待评分物品的预测评分值,然后根据预测评分值为用户推荐物品。...

【技术特征摘要】
1.一种基于异构信息网络的个性化推荐方法,其步骤包括:1)将用户对物品的评分数据集分为训练集和测试集;其中,评分数据集中的每一条评分记录包含用户对物品的喜好程度打分;构建评分预测架构,其包括特征提取器、基于注意力的特征增强模块和基于分层次特征交互的评分预测模块;其中,特征提取器用于生成用户的表示向量、物品的表示向量以及提取元图上用户和物品的潜在特征;基于注意力的特征增强模块包含用户注意力网络和物品注意力网络,用户注意力网络用于对用户的潜在特征的重要性进行区分;物品注意力网络用于对物品的潜在特征的重要性进行区分;基于分层次特征交互的评分预测模块用于特征相关性挖掘,包括用户各加权潜在特征之间的内在联系,物品各加权潜在特征之间的内在联系,用户与其加权潜在特征之间的相关性,物品与其加权潜在特征之间的相关性,以及用户和物品之间的特征交互关系;2)将训练集中用户对物品的评分记录输入到特征提取器中,得到用户的表示向量、物品的表示向量并提取元图上用户和物品的潜在特征;然后将不同潜在特征输入到基于注意力的特征增强模块,学习得到各潜在特征的权值,将权值与潜在特征进行点乘操作,得到加权潜在特征;然后将加权潜在特征、用户的表示向量以及物品的表示向量输入基于分层次特征交互的评分预测模块进行评分预测,然后根据预测值与真实值之间的误差更新网络参数,直到评分预测模型收敛且在测试集上的效果达到最优;3)将测试集中用户的ID和待评分物品的ID输入到步骤2)训练得到的评分预测模型中,得到各用户对每一待评分物品的预测评分值,然后根据预测评分值为用户推荐物品。2.如权利要求1所述的方法,其特征在于,通过查表操作生成用户的表示向量和物品的表示向量;基于元图的用户-物品相似度矩阵计算和矩阵因子分解得到用户的潜在特征和物品的潜在特征;其中,用户-物品相似度矩阵U表示用户,R表示用户对物品的评论,I表示物品,K表示评论中所提及的关键词,WUR表示用户和评论之间的邻接矩阵,WRI表示评论和物品之间的邻接矩阵,WRK表示评论和关键词之间的邻接矩阵,WUI表示用户和物品之间的邻接矩阵,⊙是两个矩阵间的点乘运算符;通过公式对用户-物品相似矩阵S进行因子分解分别获得用户的潜在特征U和物品的潜在特征I;其中,λu和λi为超参数。3.如权利要求1所述的方法,其特征在于,用户各加权潜在特征之间的内在联系为物品各加权潜在特征之间的内在联系为其中,C表示元图的个数,表示第i个元图上用户的加权潜在特征矩阵,表示第i个元图上物品的加权潜在特征矩阵。4.如权利要求1所述的方法,其特征在于,用户与其加权潜在特征之间的相关性为物品与其加权潜在特征之间的相关性为其中,X为用户的表示向量矩阵,Y为物品的表示向量矩阵,C表示元图的个数,表示第i个元图上用户的加权潜在特征矩阵,表示第i...

【专利技术属性】
技术研发人员:代飞飞古晓艳李波张金超钱明达王伟平
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1