The invention discloses a method for recommending academic papers based on depth alignment matrix decomposition model, which includes: mapping users, papers, papers and words to low-dimensional feature space of the same dimension through two non-linear multi-layer perceptrons respectively; maximizing the two low-dimensional representation vectors of the same paper The similarity is a bridge between two nonlinear multilayer perceptrons. Finally, by passing the information through the \thesis information bridge\, we train the two parts of perceptron in turn. In this way, when training the perceptron of the \user-paper\ part, we can use the information of the \paper-word\ part; when training the perceptron of the \paper-word\ part, we can use the information of the \user-paper\ part. Therefore, the invention can simultaneously use \user paper collection record\ and \paper content text information\ to contribute to user's paper recommendation.
【技术实现步骤摘要】
一种基于深度对齐矩阵分解模型进行学术论文推荐的方法
本专利技术涉及一种基于深度对齐矩阵分解模型进行学术论文推荐的方法。
技术介绍
目前,随着互联网的发展,网上充斥着大量的学术论文,导致研究者们面临严重的信息过剩的问题。据估计,截至2014年,网上已经有几百亿的学术论文了,而且还在以每天6,000多篇的数量增长。如何能帮助研究者用户们快速的从如此大量的论文库中找到他们可能感兴趣的文章,成为人们关注的问题。当前大多数相关工作采用基于关键词检索的方法,将学术论文当作普通的一些网页处理。然而这些方法既忽略了论文本身的结构化特征,也没有针对用户进行个性化建模。近年来,随着如Mendeley、CiteULike等社交网络的兴起,提供了大量的“用户-论文”交互信息。例如:CiteULike网站上,用户可以创建他们自己的图书馆用来存放他们喜欢论文。有了这些数据,可以使用学术论文推荐算法处理论文数量过多、信息过剩的问题。现有的一些工作,主要利用“用户-论文”交互信息,基于假设“对于相似的论文,用户倾向于给出相似的打分”,使用基于协同过滤的推荐算法解决学术论文推荐问题。在众多的基于协同过滤的方法中,矩阵分解是一种比较成功的方法,并被广泛使用在很多推荐领域如“电影推荐”、“社交网络推荐”等。基于矩阵分解的协同过滤方法的主要思想是将“用户-项目”打分矩阵分解到低维空间,然后在低维空间上通过相似度计算进行推荐。然而仅仅使用“用户-论文”交互信息的协同过滤方法会面临冷启动的问题,即一篇未被打分过的新论文不会被考虑推荐用户。因此,当前已经有一些工作探索如何能在协同过滤的基础上,使用“论 ...
【技术保护点】
1.一种基于深度对齐矩阵分解模型进行学术论文推荐的方法,其特征在于,包括如下步骤:步骤1,构建论文与用户输入矩阵U、论文与单词输入矩阵P;步骤2,通过第一个非线性多层感知器对输入矩阵U做矩阵分解,将用户和论文映射同一个低维空间上,分别得到用户的低维表示向量vu和论文的低维表示向量vp;通过第二个非线性多层感知器对输入矩阵P做矩阵分解,将论文和单词映射同一个低维空间上,分别得到论文的低维表示向量v’p和单词的低维表示向量vz;步骤3,轮流训练第一个非线性多层感知器和第二个非线性多层感知器,且在每个非线性多层感知器的损失函数中,加入最大化论文的两种表示vp和v’p之间的相似度作为约束;步骤4,根据每个用户的低维表示向量vu和候选论文表示(vp+v’p)之间的内积值,给用户推荐论文。
【技术特征摘要】
1.一种基于深度对齐矩阵分解模型进行学术论文推荐的方法,其特征在于,包括如下步骤:步骤1,构建论文与用户输入矩阵U、论文与单词输入矩阵P;步骤2,通过第一个非线性多层感知器对输入矩阵U做矩阵分解,将用户和论文映射同一个低维空间上,分别得到用户的低维表示向量vu和论文的低维表示向量vp;通过第二个非线性多层感知器对输入矩阵P做矩阵分解,将论文和单词映射同一个低维空间上,分别得到论文的低维表示向量v’p和单词的低维表示向量vz;步骤3,轮流训练第一个非线性多层感知器和第二个非线性多层感知器,且在每个非线性多层感知器的损失函数中,加入最大化论文的两种表示vp和v’p之间的相似度作为约束;步骤4,根据每个用户的低维表示向量vu和候选论文表示(vp+v’p)之间的内积值,给用户推荐论文。2.根据权利要求1所述的方法,其特征在于,步骤1包括如下步骤:步骤1-1,每一个用户由唯一的用户id标识,每一篇论文由唯一的论文id标识,每一个用户拥有一个在线收藏夹,其中存放着其感兴趣的论文;由用户的在线收藏夹构建论文与用户输入矩阵U:如果论文i在用户j的在线收藏夹中,则矩阵U的第i行第j列值Uij为1,否则为0;步骤1-2,论文的文本内容包括论文的标题和摘要,对每篇论文处理得到该论文的关键词列表,所有论文的关键词列表一起构成关键词词典,从而构建论文与单词输入矩阵P:如果单词k在论文i中,则矩阵P的第i行第k列值Pik为1,否则为0。3.根据权利要求2所述的方法,其特征在于,步骤1-2中,采用如下方法对每篇论文处理得到该论文的关键词列表:对论文中的每个单词求其tfidf值,然后对所有的单词按照其tfidf值的大小降序排序,选择tfidf值前10的单词作为关键词列表返回。4.根据权利要求3所述的方法,其特征在于,步骤2包括如下步骤:步骤2-1,从论文与用户输入矩阵U中,分别得到论文pi和用户uj的原始表示为矩阵U第i行数据组成的向量Ui*和第j列数据组成的向量U*j;从论文与单词输入矩阵P中,分别得到论文pi和单词zk的原始表示为第i行数据组成的向量Pi*和第k列数据组成的向量P*k;步骤2-2,经过非线性多层感知器的每一层,输入向量都会被映射到新的语义空间上的向量,形式化定义两个非线性多层感知器:用x表示输入向量,y表示输出向量,li表示第i个中间的隐层,i=1,2,3,...,N-1,使用均值为0,方差为0.1的正态分布随机构造并初始化N个权重矩阵W1,Wi-1......WN,使用均值为0,方差为0.1的正态分布生成N个随机常数值b1,bi-1......bN,WN表示第N个权重矩阵,bN表示第N个常数值,则:l1=W1x,li=f(Wi-1li-1+bi),i=2,3,...,N-1y=f(WNlN-1+bN).步骤2-3,对于第一个非线性多层感知器中的每一层的激活函数f,使用ReLU:f(x)=max(0,x),以U作为输入,获取用户uj的在输出层低维空间的向量表示和论文pi的在输出层低维空间的向量表示步骤2-4,对于第二个非线性多层感知器中的每一层的激活函数f,使用ReLU:f(x)=max(0,x),以P作为输入,获取论文pi的在输出层低维空间的向量表示和单词zk的在输出层低维空间的向量表示步骤2-5,获得在最后一个隐层语义空间上对Uij的预测值和Pik的预测值由此获得了预测矩阵和预测矩阵预测矩阵的第i行第j列值为预测矩阵的第i行第k列值为步骤2...
【专利技术属性】
技术研发人员:戴新宇,戴瑾,黄书剑,张建兵,尹存燕,陈家骏,
申请(专利权)人:南京大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。