基于本体的智能语义文献检索推理系统技术方案

技术编号:8323593 阅读:215 留言:0更新日期:2013-02-14 01:38
本发明专利技术公开了一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括:本体库,所述本体库构建有文献领域内关于文献的知识内容;规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系;显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。该系统可以避免用户常规检索的结果繁杂,难以获得有用的信息。

【技术实现步骤摘要】

本专利技术属于数据智能处理分析
,具体涉及一种基于本体的智能语义文献检索推理系统
技术介绍
传统的搜索不够智能,机器不能理解人类的语言,人机之间的交流困难,从而导致搜索出的信息不够准确。比如说烟灰色的水墨画,结果却是一个烟灰缸,等等。语义的搜索引擎,更加的智能化,可以给每个信息实例加上各式各样的标签,并读懂关键字之间的逻辑关系,大大增加了检索效率,但是目前语义的研究才处于起步阶段,各种技术都不是很成熟。 本体是一种知识库对领域事物的描述,带有语义性,可以说是另一种数据库。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。总的来说,构造本体可以实现某种程度的知识共享和重用,以及提高系统通讯、互操作、可靠性的能力。数据的含义就是语义。简单的说,数据就是符号。数据本身没有任何意义,只有被赋予含义的数据才能够被使用,这时候数据就转化为了信息,而数据的含义就是语义。语义具有领域性特征,不属于任何领域的语义是不存在的。而语义异构则是指对同一事物在解释上所存在差异,也就体现为同一事物在不同领域中理解的不同。对于计算机科学来说,语义一般是指用户对于那些用来描述现实世界的计算机表示(即符号)的解释,也就是用户用来联系计算机表示和现实世界的途径。语义是对数据符号的解释,而语法则是对于这些符号之间的组织规则和结构关系的定义。对于信息集成领域来说,数据往往是通过模式(对于模式不存在或者隐含的非结构化和半结构化数据,往往需要在集成前定义出它们的模式)来组织的,数据的访问也是通过作用于模式来获得的,这时语义就是指模式元素(例如类、属性、约束等等)的含义,而语法则是模式元素的结构。语义网是Semantic Web的中文名称。语义网就是能够根据语义进行判断的网络。简单地说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。现有技术中对检索的个性化服务要求更多,而基于本体的语义检索大多停留在理论研究,真正实例很少。本专利技术因此而来。
技术实现思路
本专利技术目的在于提供一种基于本体的智能语义文献检索推理系统,解决了现有技术中海量数据进行搜索时,会耗费大量的时间等问题。为了解决现有技术中的这些问题,本专利技术提供的技术方案是一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括本体库,所述本体库构建有文献领域内关于文献的知识内容;规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系;显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。优选的,所述本体库包括文章、作者、出版社本体;本体的数据类型包括内容、标题、关键字,本体的对象属性包括引用,被引用属性。优选的,所述规则库是对本体的对象属性规则的描述和说明,所加载的规则推理机为Reasoner推理机。本专利技术的另一目的在于提供一种采用所述的智能语义文献检索推理系统进行展示的方法,其特征在于所述方法包括以下步骤 (2)用户在显示界面上输入需要检索的关键词,并进行检索查询;(3)权利要求I所述的智能语义文献检索推理系统导入规则库,将与关键词相关的语义检索结果检索出来,并通过显示界面展示给用户。本专利技术与现有技术相比,具有如下的有益效果本专利技术技术方案通过对本体库的建立,加载规则推理机,对文献相关信息进行查询检索,通过查询结果的综合,将与此文献相关的信息——共同引用了同一篇文献、被一篇文献引用等信息推荐给用户,可以避免用户常规检索的结果繁杂,难以获得有用的信息。附图说明下面结合附图及实施例对本专利技术作进一步描述图I为本专利技术技术方案采用所述的智能语义文献检索推理系统进行展示的方法流程图;图2为本专利技术技术方案中智能语义检索推理系统本体库的框架结构图;图3为本专利技术技术方案中智能语义检索推理系统本体库的另一框架结构图;图4为本专利技术技术方案中智能语义检索推理系统本体库中各文献之间的相互引用关系。图5为现有技术中旧模式下的文献检索展示的方法流程图。具体实施例方式以下结合具体实施例对上述方案做进一步说明。应理解,这些实施例是用于说明本专利技术而不限于限制本专利技术的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整,未注明的实施条件通常为常规实验中的条件。实施例本实施例以图书馆文献系统为例,建立文献的知识领域模型。对这种个性化的基于本体的智能搜索进行探索,通过构建本体知识库,编写规则,实现语义检索,探索用户选择搜索规则的可行性。本实施例的智能语义检索推理系统主要分三个模块本体库、规则库、显示界面,以下具体介绍每个模块的具体功能(I)本体库通过查阅文献,与专家沟通,确定文献的知识领域。利用对对文献领域知识的理解,确定该领域内共同认可的属性,并从不同层次的形式化模式上给出这些词汇,术语和词汇间相互关系的明确定义。在这种基础上,构建了文献的只是库,包括Class :文章、作者、出版社!Datatype属性内容、标题、关键字;0bject属性引用,被引用等;类的实例:文章、作者、出版社..。本体库构建了 Class、Datatype属性、Object属性之间的相互关系,比如作者jack对应了一篇文献articlel,属于Sci出版社(class),此文献有内容、关键字、标题等(datatype 属性),并且引用了 article3 和 article4,被 article5 引用(object 属性)。本体库实际上就是一个知识领域,反映了在这个领域中各种实体与属性之间的复杂关系。 (2)规则库创建Object新属性被同时引用,同时引用,并构建规则库,构建新建属性与之前属性的逻辑关系,利用规则,推理出各实例之间新的属性关系。这是本专利技术所用到的推理规则I) [bothCiting:( a http://www. domain2. com#Citing c),( b http://www. domain2. com#Citing c),notEqual ( a, b)->( a http://www. domain2. com#bothCiting b)]//a引用c,b也引用c,且a、b不相等,则推出他们具有同时引用的关系a#bothCiting b。2) [bothCited:( a http://www. domain2. com#Citing b),( a http://www. domain2. com#Citing c),notEqual ( b, c)->( b http://www. domain2. com#bothCited c)]//a引用b,a也引用c,且b、c不相等,则推出他们具有同时被引用的关系,b#bothCited C。(3)显示界面利用j2ee技术,tomcat作为服务器,利用网页作为本专利技术的项目结果显示界面。主界面是一个检索界面,包含检索项和检索值,可以选择标题、关键字、作者,进行检索;检索之后,点击搜索结果,可以查看文献详情,会显示编号、标题、关键字、作者、文献出处,内容,引用文献列表,被引用文献列表,同时引用文献列表、被同时引用文献列表。每一篇文献本文档来自技高网
...

【技术保护点】
一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括:本体库,所述本体库构建有文献领域内关于文献的知识内容;规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系;显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。

【技术特征摘要】
1.一种基于本体的智能语义文献检索推理系统,其特征在于所述系统包括 本体库,所述本体库构建有文献领域内关于文献的知识内容; 规则库,采用规则获得关于文献新的属性与原有属性的逻辑关系; 显示界面,用于提示用户进行输入操作,并将检索推理结果展示给用户。2.根据权利要求I所述的基于本体的智能语义文献检索推理系统,其特征在于所述本体库包括文章、作者、出版社本体;本体的数据类型包括内容、标题、关键字,本体的对象属性包括引用,被引用属性。3.根据权利要求I所述的基于本体...

【专利技术属性】
技术研发人员:陈国庆周礼仁
申请(专利权)人:苏州两江科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1