当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于深度对齐矩阵分解模型进行学术论文推荐的方法技术

技术编号:19342172 阅读:24 留言:0更新日期:2018-11-07 13:54
本发明专利技术公开了一种基于深度对齐矩阵分解模型进行学术论文推荐的方法,包括:分别通过两个非线性多层感知器,将用户和论文以及论文和单词映射到相同维度的低维特征空间;通过最大化同一篇论文的两种低维表示向量之间的相似度,在两个非线性多层感知器之间搭建起一个“桥梁”。最后,通过这个“论文信息桥梁”传递信息,轮流训练这两部分感知器。由于通过这种方法,在训练“用户‑论文”部分的感知器时,能借助“论文‑单词”部分的信息;在训练“论文‑单词”部分的感知器时,能借助“用户‑论文”部分的信息。所以,本发明专利技术可以同时使用“用户‑论文收藏记录”、“论文内容文本信息”,共同为用户论文推荐做贡献。

A method of recommending academic papers based on depth alignment matrix decomposition model

The invention discloses a method for recommending academic papers based on depth alignment matrix decomposition model, which includes: mapping users, papers, papers and words to low-dimensional feature space of the same dimension through two non-linear multi-layer perceptrons respectively; maximizing the two low-dimensional representation vectors of the same paper The similarity is a bridge between two nonlinear multilayer perceptrons. Finally, by passing the information through the \thesis information bridge\, we train the two parts of perceptron in turn. In this way, when training the perceptron of the \user-paper\ part, we can use the information of the \paper-word\ part; when training the perceptron of the \paper-word\ part, we can use the information of the \user-paper\ part. Therefore, the invention can simultaneously use \user paper collection record\ and \paper content text information\ to contribute to user's paper recommendation.

【技术实现步骤摘要】
一种基于深度对齐矩阵分解模型进行学术论文推荐的方法
本专利技术涉及一种基于深度对齐矩阵分解模型进行学术论文推荐的方法。
技术介绍
目前,随着互联网的发展,网上充斥着大量的学术论文,导致研究者们面临严重的信息过剩的问题。据估计,截至2014年,网上已经有几百亿的学术论文了,而且还在以每天6,000多篇的数量增长。如何能帮助研究者用户们快速的从如此大量的论文库中找到他们可能感兴趣的文章,成为人们关注的问题。当前大多数相关工作采用基于关键词检索的方法,将学术论文当作普通的一些网页处理。然而这些方法既忽略了论文本身的结构化特征,也没有针对用户进行个性化建模。近年来,随着如Mendeley、CiteULike等社交网络的兴起,提供了大量的“用户-论文”交互信息。例如:CiteULike网站上,用户可以创建他们自己的图书馆用来存放他们喜欢论文。有了这些数据,可以使用学术论文推荐算法处理论文数量过多、信息过剩的问题。现有的一些工作,主要利用“用户-论文”交互信息,基于假设“对于相似的论文,用户倾向于给出相似的打分”,使用基于协同过滤的推荐算法解决学术论文推荐问题。在众多的基于协同过滤的方法中,矩阵分解是一种比较成功的方法,并被广泛使用在很多推荐领域如“电影推荐”、“社交网络推荐”等。基于矩阵分解的协同过滤方法的主要思想是将“用户-项目”打分矩阵分解到低维空间,然后在低维空间上通过相似度计算进行推荐。然而仅仅使用“用户-论文”交互信息的协同过滤方法会面临冷启动的问题,即一篇未被打分过的新论文不会被考虑推荐用户。因此,当前已经有一些工作探索如何能在协同过滤的基础上,使用“论文本身的文本内容”作为辅助信息,进行更好的推荐。例如:协同话题回归模型(CollaborativeTopicRegressionModel,简称CTR)、协同深度学习模型(CollaborativeDeepLearningModel,简称CDL)。CTR将潜在狄利克雷分配(LatentDirichletAllocation,简称LDA)文本处理模型和概率协同过滤模型(ProbabilisticMatrixFactorization,简称PMF)结合在一起,做混合推荐。然而,当论文文本信息稀疏时,LDA的表现不是很好。因此,CDL在CTR的基础上,代替LDA,进一步使用深度学习方法多层降噪自动编码机StackedDenoisingAutoencoders,简称SDAE)模型处理文本内容,并和PMF结合起来做混合推荐。上述的混合方法是利用论文的文本内容解决协同过滤方法中的冷启动问题,而对“用户-论文”打分矩阵稀疏问题,没有大的改善。另外,它们对两种数据源信息的融合方法是直接将辅助的文本信息直接“加和”到协同过滤的过程中,这种处理方式显然太粗糙,对两种数据源的融合并不是很深入。于是,本专利技术希望找到一种新的混合推荐模型,能够在使用“用户-论文交互信息”的协同过滤方法基础上,更好的利用“论文本身的文本内容”这种辅助信息解决交互数据稀疏以及论文冷启动的问题,进行更好的学术论文推荐。
技术实现思路
专利技术目的:为了克服现有协同过滤推荐方法中“用户-论文交互数据稀疏”以及论文冷启动的问题,本专利技术使用了一种新型的混合推荐算法,将论文的文本内容加入到基于协同过滤推荐的算法中,同时使用“用户-论文交互”以及“论文的文本内容”两种数据源的信息,向用户推荐其感兴趣的学术论文。本专利技术提供了一种基于深度对齐矩阵分解模型进行学术论文推荐的方法,分别对两种数据源“用户-论文交互”信息、“论文文本内容”信息,构造两个多层感知器;因为两个感知器分别会为同一篇论文学习到一种向量表示,本专利技术通过最大化这两种论文表示之间的相似度,在两个多层感知器之间搭建起一座“桥梁”,由此获得一个深度对齐模型;通过训练这个模型,可以使得这两种数据源同时为学术论文推荐做贡献,具体步骤如下:包括如下步骤:步骤1,构建论文与用户输入矩阵U、论文与单词输入矩阵P;步骤2,通过第一个非线性多层感知器对输入矩阵U做矩阵分解,将用户和论文映射同一个低维空间上,分别得到用户的低维表示向量vu和论文的低维表示向量vp;通过第二个非线性多层感知器对输入矩阵P做矩阵分解,将论文和单词映射同一个低维空间上,分别得到论文的低维表示向量v’p和单词的低维表示向量vz;步骤3,轮流训练第一个非线性多层感知器和第二个非线性多层感知器,且在每个非线性多层感知器的损失函数中,加入最大化论文的两种表示vp和v’p之间的相似度作为约束;步骤4,根据每个用户的低维表示向量vu和候选论文表示(vp+v’p)之间的内积值,给用户推荐论文。步骤1包括如下步骤:步骤1-1,每一个用户由唯一的用户id标识,每一篇论文由唯一的论文id标识,每一个用户拥有一个在线收藏夹,其中存放着其感兴趣的论文;由用户的在线收藏夹构建论文与用户输入矩阵U:如果论文i在用户j的在线收藏夹中,则矩阵U的第i行第j列值Uij为1,否则为0;步骤1-2,论文的文本内容包括论文的标题和摘要,对每篇论文处理得到该论文的关键词列表,所有论文的关键词列表一起构成关键词词典,从而构建论文与单词输入矩阵P:如果单词k在论文i中,则矩阵P的第i行第k列值Pik为1,否则为0。步骤1-2中,采用如下方法对每篇论文处理得到该论文的关键词列表:对论文中的每个单词求其tfidf值(参照文献SPARCKJONESK.DocumentRetrievalSystems[C/OL]//WILLETTP..London,UK,UK:TaylorGrahamPublishing,1988:132–142.),然后对所有的单词按照其tfidf值的大小降序排序,选择tfidf值前10的单词作为关键词列表返回。步骤2包括如下步骤:步骤2-1,从论文与用户输入矩阵U中,分别得到论文pi和用户uj的原始表示为矩阵U第i行数据组成的向量Ui*和第j列数据组成的向量U*j;从论文与单词输入矩阵P中,分别得到论文pi和单词zk的原始表示为第i行数据组成的向量Pi*和第k列数据组成的向量P*k;步骤2-2,经过非线性多层感知器的每一层,输入向量都会被映射到新的语义空间上的向量,形式化定义两个非线性多层感知器:用x表示输入向量,y表示输出向量,li(i=1,2,3,...,N-1)表示第i个中间的隐层(参照文献:XUEH,DAIX,ZHANGJ,etal.DeepMatrixFactorizationModelsforRecommenderSystems[C/OL]//ProceedingsoftheTwenty-SixthInternationalJointConferenceonArtificialIntelligence,IJCAI-17.2017:3203–3209,),使用均值为0,方差为0.1的正态分布随机构造并初始化N个权重矩阵W1,Wi-1......WN,使用均值为0,方差为0.1的正态分布生成N个随机常数值b1,bi-1......bN,WN表示第N个权重矩阵,bN表示第N个常数值,公式f()表示感知器每一层的激活函数,f的具体的定义如步骤2-3、2-4所示,则:步骤2-3,对于第一个非线性多层感知器中的每一层的激活本文档来自技高网
...

【技术保护点】
1.一种基于深度对齐矩阵分解模型进行学术论文推荐的方法,其特征在于,包括如下步骤:步骤1,构建论文与用户输入矩阵U、论文与单词输入矩阵P;步骤2,通过第一个非线性多层感知器对输入矩阵U做矩阵分解,将用户和论文映射同一个低维空间上,分别得到用户的低维表示向量vu和论文的低维表示向量vp;通过第二个非线性多层感知器对输入矩阵P做矩阵分解,将论文和单词映射同一个低维空间上,分别得到论文的低维表示向量v’p和单词的低维表示向量vz;步骤3,轮流训练第一个非线性多层感知器和第二个非线性多层感知器,且在每个非线性多层感知器的损失函数中,加入最大化论文的两种表示vp和v’p之间的相似度作为约束;步骤4,根据每个用户的低维表示向量vu和候选论文表示(vp+v’p)之间的内积值,给用户推荐论文。

【技术特征摘要】
1.一种基于深度对齐矩阵分解模型进行学术论文推荐的方法,其特征在于,包括如下步骤:步骤1,构建论文与用户输入矩阵U、论文与单词输入矩阵P;步骤2,通过第一个非线性多层感知器对输入矩阵U做矩阵分解,将用户和论文映射同一个低维空间上,分别得到用户的低维表示向量vu和论文的低维表示向量vp;通过第二个非线性多层感知器对输入矩阵P做矩阵分解,将论文和单词映射同一个低维空间上,分别得到论文的低维表示向量v’p和单词的低维表示向量vz;步骤3,轮流训练第一个非线性多层感知器和第二个非线性多层感知器,且在每个非线性多层感知器的损失函数中,加入最大化论文的两种表示vp和v’p之间的相似度作为约束;步骤4,根据每个用户的低维表示向量vu和候选论文表示(vp+v’p)之间的内积值,给用户推荐论文。2.根据权利要求1所述的方法,其特征在于,步骤1包括如下步骤:步骤1-1,每一个用户由唯一的用户id标识,每一篇论文由唯一的论文id标识,每一个用户拥有一个在线收藏夹,其中存放着其感兴趣的论文;由用户的在线收藏夹构建论文与用户输入矩阵U:如果论文i在用户j的在线收藏夹中,则矩阵U的第i行第j列值Uij为1,否则为0;步骤1-2,论文的文本内容包括论文的标题和摘要,对每篇论文处理得到该论文的关键词列表,所有论文的关键词列表一起构成关键词词典,从而构建论文与单词输入矩阵P:如果单词k在论文i中,则矩阵P的第i行第k列值Pik为1,否则为0。3.根据权利要求2所述的方法,其特征在于,步骤1-2中,采用如下方法对每篇论文处理得到该论文的关键词列表:对论文中的每个单词求其tfidf值,然后对所有的单词按照其tfidf值的大小降序排序,选择tfidf值前10的单词作为关键词列表返回。4.根据权利要求3所述的方法,其特征在于,步骤2包括如下步骤:步骤2-1,从论文与用户输入矩阵U中,分别得到论文pi和用户uj的原始表示为矩阵U第i行数据组成的向量Ui*和第j列数据组成的向量U*j;从论文与单词输入矩阵P中,分别得到论文pi和单词zk的原始表示为第i行数据组成的向量Pi*和第k列数据组成的向量P*k;步骤2-2,经过非线性多层感知器的每一层,输入向量都会被映射到新的语义空间上的向量,形式化定义两个非线性多层感知器:用x表示输入向量,y表示输出向量,li表示第i个中间的隐层,i=1,2,3,...,N-1,使用均值为0,方差为0.1的正态分布随机构造并初始化N个权重矩阵W1,Wi-1......WN,使用均值为0,方差为0.1的正态分布生成N个随机常数值b1,bi-1......bN,WN表示第N个权重矩阵,bN表示第N个常数值,则:l1=W1x,li=f(Wi-1li-1+bi),i=2,3,...,N-1y=f(WNlN-1+bN).步骤2-3,对于第一个非线性多层感知器中的每一层的激活函数f,使用ReLU:f(x)=max(0,x),以U作为输入,获取用户uj的在输出层低维空间的向量表示和论文pi的在输出层低维空间的向量表示步骤2-4,对于第二个非线性多层感知器中的每一层的激活函数f,使用ReLU:f(x)=max(0,x),以P作为输入,获取论文pi的在输出层低维空间的向量表示和单词zk的在输出层低维空间的向量表示步骤2-5,获得在最后一个隐层语义空间上对Uij的预测值和Pik的预测值由此获得了预测矩阵和预测矩阵预测矩阵的第i行第j列值为预测矩阵的第i行第k列值为步骤2...

【专利技术属性】
技术研发人员:戴新宇戴瑾黄书剑张建兵尹存燕陈家骏
申请(专利权)人:南京大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1