本发明专利技术公开了基于知识组织语义关系的学术论文引文推荐方法及系统,该方法包括:预先构建引用文献知识库和本体库,并建立基于本体的知识组织模式;建立基于语义关系的引用文献属性关联体系,并通过Jena推理机进行引用文献之间的关系推理;建立学术论文引文推荐搜索界面,并设置图片搜索推荐功能;将需要搜索的图片拖入图片搜索推荐功能范围,则依据该图片进行学术论文的引文推荐;该系统包括知识组织模块、语义推理模块及图片搜索模块。本发明专利技术可以当用户对相关领域不熟悉的情况下,依然能够通过图片进行搜搜推荐引用论文,提高搜索效率;且计算待搜索图像与各个主要图像相似度,按相似度从高到低的顺序作为推荐引用文献向用户展示。展示。展示。
【技术实现步骤摘要】
基于知识组织语义关系的学术论文引文推荐方法及系统
[0001]本专利技术涉及文献影响力分析和信息可视化领域,具体来说,涉及基于知识组织语义关系的学术论文引文推荐方法及系统。
技术介绍
[0002]知识组织始见于1929年美国图书馆学家布利斯的专著,并在图书馆学、情报学的分类系统和叙词表研究基础上发展起来的。知识组织就是对知识元素的本质内容和知识元素之间的关联进行揭示和序化的活动。语义关系指语言单位之间在意义上的关系,主要表现为纵的方向上的聚合关系和横的方向上的组合关系,以及逻辑关系。
[0003]在学术论文中一般均会引用相关领域的论文或其它文章,引用的目的不是引用文章本身,而是解释你自己的主题和观点。引用参考文献质量的高低在一定程度上反映了学术论文水平的高低,从总体上体现了学术论文的科掌性、实用性和先进性。
[0004]现有的学术论文引文推荐方法,例如中国专利201510957990.2公开了一种文献引用网络可视化及文献推荐方法及系统,其对排序后的文献进行聚类,并对聚类的结果进行可视化,构建双层网络模型,将其重要文献以清晰明了的方式展示出来,帮助科研工作者快速地筛选出最具权威的论文。但是上述推荐方法存在以下不足:在文献的推荐时,依然采用常规的通过关键字的文献检索和浏览方式进行检索推荐,然而对于初次进入某个研究领域的人员,由于对该领域的认识还比较模糊,上述方法效率不高。
[0005]针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
[0006]针对相关技术中的问题,本专利技术提出基于知识组织语义关系的学术论文引文推荐方法及系统,以克服现有相关技术所存在的上述技术问题。
[0007]为此,本专利技术采用的具体技术方案如下:
[0008]根据本专利技术的一个方面,提供了基于知识组织语义关系的学术论文引文推荐方法,该方法包括以下步骤:
[0009]S1、预先构建引用文献知识库和本体库,并建立基于本体的知识组织模式;
[0010]S2、建立基于语义关系的引用文献属性关联体系,并通过Jena推理机进行引用文献之间的关系推理;
[0011]S3、建立学术论文引文推荐搜索界面,并设置图片搜索推荐功能;
[0012]S4、将需要搜索的图片拖入图片搜索推荐功能范围,则依据该图片进行学术论文的引文推荐。
[0013]进一步的,所述预先构建引用文献知识库和本体库,并建立基于本体的知识组织模式包括以下步骤:
[0014]对引用文献进行学科领域的划分,并针对不同学科领域构建领域本体;
[0015]对领域本体中的概念术语及知识关联进行语义分类,并在语义分类后建立索引,
存储至语义空间;
[0016]将领域本体作为检索的语义概念层,用户在进行引用文献的推荐搜索时,以本体库中的语词关系为基础进行检索;
[0017]其中,所述领域本体包括引用文献、作者及出版社。
[0018]进一步的,所述对引用文献进行学科领域的划分包括以下步骤:
[0019]将引用文献的学科分为十个主学科;
[0020]每个主学科下分为十个细分类;
[0021]每个细分类下分为十个细分小类。
[0022]进一步的,所述建立基于语义关系的引用文献属性关联体系包括以下步骤:
[0023]建立任一文献与其参考文献之间的有序关系,并描述该文献的研究背景、研究依据及相关工作;
[0024]建立任一文献与引用它的文献之间的有序关系,并描述该文献研究工作的发展;
[0025]建立任一文献与作者及出版社之间的关系。
[0026]进一步的,所述通过Jena推理机进行引用文献之间的关系推理包括以下步骤:
[0027]在引用文献的检索过程中,利用Jena推理机进行引用文献的查询;
[0028]其中,若文献1与文献2同时引用文献3,且文献1与文献2非同一篇文章,则文献1与文献2为同引关系;
[0029]若文献1同时引用文献2及文献3,且文献2及文献3非同一篇文章,则文献2及文献3为同被引关系。
[0030]进一步的,所述将需要搜索的图片拖入图片搜索推荐功能范围,则依据该图片进行学术论文的引文推荐包括以下步骤:
[0031]学术论文引文推荐搜索界面设置入图片搜索推荐功能范围,用户将待搜索图像拖入该图片搜索推荐功能范围,则计算待搜索图像与其它文献中的主要图像之间的相似度;
[0032]将相似度排名前十的文献作为推荐引用文献。
[0033]进一步的,所述计算待搜索图像与其它文献中的主要图像之间的相似度之前包括以下步骤:
[0034]对于任一文献,审核人员在对该文献审核之后,挑选出一张该文献的主要图像;
[0035]审核人员在主要图像的轮廓外侧画出红色矩形框,并基于Matlab将主要图像的坐标信息及红色矩形框的高宽信息放入txt文件;
[0036]提取红色矩形框内的图像,并转换成二值图像。
[0037]进一步的,所述计算待搜索图像与其它文献中的主要图像之间的相似度包括以下步骤:
[0038]对于待搜索图像或任一主要图像有平面通过d维协方差矩阵描述区域额特征;
[0039]设I为待搜索图像或任一主要图像,W和H分别表示图像的高度和宽度,则高度和宽度的特征相邻为(W,H);
[0040]设定图像的特征向量为a=(a1,a2,
……
,a
n
),则该区域的协方差矩阵为:
[0041][0042]式中,D(a
i
,a
j
)为a
i
和a
j
组成的行向量的方差;
[0043]COV(a
i
,a
j
)为a
i
和a
j
组成的行向量的协方差;
[0044]根据协方差矩阵计算待搜索图像与任一主要图像之间的距离。
[0045]进一步的,所述根据协方差矩阵计算待搜索图像与任一主要图像之间的距离包括以下步骤:
[0046]计算得到待搜索图像与任一主要图像的协方差矩阵C
R1
及C
R2
;
[0047]计算得到待搜索图像与任一主要图像中行向量的元素距离矩阵d,其中,d为加权有向图;
[0048]以d(1,1)作为加权有向图的起点,以d(i,j)作为加权有向图的终点,并基于Dijkstra算法计算待搜索图像与任一主要图像中每行任意两个节点之间的最短路径,并进行归一化处理;
[0049]若归一化处理后的最短路径超过阈值,则该最短距离对应的行数记为零,且若某一主要图像中零值的个数超过一半,则该主要图像与待搜索图像不相似;
[0050]根据主要图像中非零值的数目按从高到低的顺序作为推荐引用文献向用户展示。
[0051]根据本专利技术的另一方面,提供了基于知识组织语义关系的学术论文引文推本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于知识组织语义关系的学术论文引文推荐方法,其特征在于,该方法包括以下步骤:S1、预先构建引用文献知识库和本体库,并建立基于本体的知识组织模式;S2、建立基于语义关系的引用文献属性关联体系,并通过Jena推理机进行引用文献之间的关系推理;S3、建立学术论文引文推荐搜索界面,并设置图片搜索推荐功能;S4、将需要搜索的图片拖入图片搜索推荐功能范围,则依据该图片进行学术论文的引文推荐。2.根据权利要求1所述的基于知识组织语义关系的学术论文引文推荐方法,其特征在于,所述预先构建引用文献知识库和本体库,并建立基于本体的知识组织模式包括以下步骤:对引用文献进行学科领域的划分,并针对不同学科领域构建领域本体;对领域本体中的概念术语及知识关联进行语义分类,并在语义分类后建立索引,存储至语义空间;将领域本体作为检索的语义概念层,用户在进行引用文献的推荐搜索时,以本体库中的语词关系为基础进行检索;其中,所述领域本体包括引用文献、作者及出版社。3.根据权利要求2所述的基于知识组织语义关系的学术论文引文推荐方法,其特征在于,所述对引用文献进行学科领域的划分包括以下步骤:将引用文献的学科分为十个主学科;每个主学科下分为十个细分类;每个细分类下分为十个细分小类。4.根据权利要求3所述的基于知识组织语义关系的学术论文引文推荐方法,其特征在于,所述建立基于语义关系的引用文献属性关联体系包括以下步骤:建立任一文献与其参考文献之间的有序关系,并描述该文献的研究背景、研究依据及相关工作;建立任一文献与引用它的文献之间的有序关系,并描述该文献研究工作的发展;建立任一文献与作者及出版社之间的关系。5.根据权利要求4所述的基于知识组织语义关系的学术论文引文推荐方法,其特征在于,所述通过Jena推理机进行引用文献之间的关系推理包括以下步骤:在引用文献的检索过程中,利用Jena推理机进行引用文献的查询;其中,若文献1与文献2同时引用文献3,且文献1与文献2非同一篇文章,则文献1与文献2为同引关系;若文献1同时引用文献2及文献3,且文献2及文献3非同一篇文章,则文献2及文献3为同被引关系。6.根据权利要求1所述的基于知识组织语义关系的学术论文引文推荐方法,其特征在于,所述将需要搜索的图片拖入图片搜索推荐功能范围,则依据该图片进行学术论文的引文推荐包括以下步骤:学术论文引文推荐搜索界面设置入图片搜索推荐功能范围,用户将待搜索图像拖入该
图片搜索推荐功能范围,则计算待搜索图像与其它文献中的主要图像之间的相似度;将相似度排名前十的文献作为推荐引用文献。7.根据权利要求6所述的基于知识组织语义关系的学术论文引文推荐方法,其特征在于,所述计算待搜索图像与其它文献中的主要图像之间的相似度之前包括以下步骤:对于任一文献,审核人员在对该文献审核之后,挑选...
【专利技术属性】
技术研发人员:习海旭,陈谦民,曹洪波,
申请(专利权)人:江苏理工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。