一种基于深度学习的隐含关系发现方法技术

技术编号：18350454 阅读：38 留言：0更新日期：2018-07-01 23:41

本发明专利技术公开了一种基于深度学习的隐含关系发现方法，属于信息技术领域，具体包括从学者发表网络G中生成论文合著网络G’；计算论文发表情况矩阵C，D，S以及论文的合著矩阵XS，XD，XT；提出了RGRU模型；在RGRU的基础上设计并构建tARMM模型来预测“导师‑学生”关系。本发明专利技术提出的tARMM模型在数据集上的预测准确度高于其他方法，能达到95％左右，对于其他具有时间依赖性的社会关系挖掘具有一定的借鉴意义和参考价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的隐含关系发现方法
本专利技术属于信息
，具体涉及一种基于深度学习的隐含关系发现方法。
技术介绍
随着Facebook、Twitter、微信等社交媒体的普及和推广，社交媒体已经成为人们之间交流交互的重要平台。不同类型的社会关系对人有着不同的影响，人们的生活、学习和工作在这些关系的潜移默化之下发生着改变，比如在社交网络中，人们的喜好会受到朋友的影响，学生的研究方向会受到导师的影响。同时，在这些关系中还隐含着大量的额外信息，比如通过研究“导师-学生”关系，可以挖掘学术团体，建立科研社区网络，进一步了解相关研究课题的发展历程，找到下一步的发展方向。网络中有很多的显式关系，如朋友关系、关注关系、评论关系、回复关系等，然而，也有很多关系是隐含在网络中的，如：“导师-学生”关系隐含在论文合著网络中。论文合著网络是科研人员在合作出版文献过程中逐渐形成的合作关系网络，比如DBLP。目前，有若干的项目以维护关系作为自己的目标，比如LinkedIn和AI家谱。前者要求用户对每一个特殊的对象进行标注，比如同事、导师、学生等，后者同样采用手工标注的方法对研究领域的导师信息进行标注。显然，这些方法大量依赖于人工的标注，不仅效率低，准确性也不高，这大大限制了其推广能力。对于这种现象一个理想的解决方案是设计一种方法，自动从网络中挖掘或预测出其中隐含的关系。在论文合著网络中，想要仅从出版名单中判断谁是导师是比较困难的。有时根据直觉的假设，采用启发式规则可以在某些社交网络中区分关系类型。但是，研究发现使用典型的启发式规则只能达到精度为70-80％，即使是使用基于多个不...
一种基于深度学习的隐含关系发现方法

【技术保护点】
1.一种基于深度学习的隐含关系发现方法，其特征在于：对隐含关系挖掘问题作出形式化的定义：定义1学者发表网络G将时间依赖的学者发表网络形式化表示为一个二部图，令G＝(A,P,E)，其中

【技术特征摘要】
1.一种基于深度学习的隐含关系发现方法，其特征在于：对隐含关系挖掘问题作出形式化的定义：定义1学者发表网络G将时间依赖的学者发表网络形式化表示为一个二部图，令G＝(A,P,E)，其中表示学者发表网络中所有作者的集合；是所有论文的集合；E＝{eik|1<＝i<＝na,1<＝k<＝np,ai是pk的作者}，表示学者发表网络中的作者与论文的著作关系；定义2论文合著网络G’从G中生成其中，是作者集合，a0是一虚拟作者，对于作者ai，假设其导师为如果那么认为E’＝{eij|1<＝i<＝na,1<＝j<＝na,ai和aj具有合作关系且ai≠aj}；其中，pnij是与eij相关的一个向量，pnij∈R1×40表示ai和aj在某一个时间域内合著的论文数量；对于单个作者来说，使用pni可以表示作者ai论文发表情况；定义3论文合著矩阵C对于A中任意一作者x，假设其与m位作者具有合著关系，合作者集合用Ax表示，Ax＝{b0,b1,b2,···,bm}，其中b0＝a0；若在某一年t中，x与bj合著的论文数为则对于作者x，有合著矩阵：其中，T为作者合作的总体时间域，本文以一年为一个时间跨度，若作者合著时间为[1970,2010]，共40年，则在上述矩阵中T＝39，合著矩阵C∈R(m+1)×40；定义4导师学生关系R令R＝{yij|0<＝i<＝na,0<＝j<＝na}，表示作者之间是否是“导师-学生”关系，其具体取值如下：所述的基于深度学习的隐含关系发现方法，具体包括如下步骤：Input：学者发表网络G；Output：“导师-学生”关系的预测结果；步骤1：对学者发表网络G中的链接进行分析，从学者发表网络G中生成论文合著网络G’；步骤2：根据论文合著网络G’，计算论文发表情况矩阵C，D，S，进而计算论文的合著矩阵XS，XD，XT；步骤3：建立tARMM模型；步骤4：通过tARMM模型对合著矩阵进行处理；步骤4.1：使用RGRU计算概率PT；步骤4.2：使用DNN计算概率PF；步骤4.3：计算最终的导师概率P；步骤5：P中最大概率的候选导师即为x的预测导师，从而得到“导师-学生”关系的预测结果。2.根据权利要求1所述的基于深度学习的隐含关系发现方法，其特征在于：在步骤2中，对于论文的合著情况，从如下两个方面进行分析：第一方面，从合著的详细情况进行分析，对于作者x，通过合著矩阵C表示x与其候选导师之间的合著论文发表情况；候选导师的论文发表情况用D表示：作者x的论文发表情况pnx用S表示：S＝(S0…ST-1)(2.3)；分别利用作者和候选导师的论文发表情况对合著矩阵C进行归一化处理：XS＝C·S(2.5)；XD＝D·S(2.6)；其中，XS为基于学生的合著子矩阵，XSij∈...

【专利技术属性】
技术研发人员：赵中英，刘文强，李超，
申请(专利权)人：山东科技大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人