当前位置: 首页 > 专利查询>淮海工学院专利>正文

一种基于事件本体的查询扩展方法技术

技术编号:7935448 阅读:183 留言:0更新日期:2012-11-01 05:13
本发明专利技术公开了一种基于事件本体的查询扩展方法,其步骤如下:(1)输入查询事件的触发词、时间、地点、人物四个要素;(2)对输入的时间要素的格式进行规整;(3)对输入的地点要素依据地点本体进行扩展;(4)判断查询事件所属的事件本体的领域;(5)进而,选取特定领域的事件本体进行查询扩展;(6)最后,计算查询项与文本的相似度,按照相似度的大小降序排列输出检索文本。该方法使用事件四元组的思想,基于已有的事件本体语义资源进行查询扩展,能显著的提高事件类信息查询结果的准确率。

【技术实现步骤摘要】

本专利技术属于信息检索
,具体地说是涉及。
技术介绍
在目前的信息检索模型与系统中,用户的查询请求通常以关键词的形式出现,传统信息检索利用简单的词匹配法则计算文档特征值与检索词间的相似度,往往只有查询词出现在文档中才可能检索到。因而,经常出现与用户查询请求相关的文档由于用词不同而无法被检索出来的情况。词不匹配成为影响信息检索效果的重要原因之一。解决这一问题,目前常采用查询扩展技术。查询扩展是指在原查询词的基础上加入相关的词,从而组成新的、更准确的查询 词集。它利用计算机语言学、信息学等多种技术,以用户原查询为基础,把与原查询相关的词添加到原查询,以便更完整地描述原查询所隐含的语义或主题,帮助信息检索系统提供更多有利于判断文档相关性的信息,是弥补用户查询信息不足,改善信息检索的查全率和查准率的有效手段。其核心问题是如何设计和利用扩展词的来源。本体作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,具有良好的概念层次结构和对逻辑推理的支持。它在计算机领域中的应用使查询扩展从基于关键词的层面提高到基于知识(或概念)的层面成为了可能。将本体融合到传统信息检索技术中,不仅可以对文档中的信息进行语义层次上的处理,还可以对用户的查询内容进行基于本体的联想推理,进而得到更为准确的查询描述。早在1994年,英国出版的会议论文集!Proceedings of the 17thannual international ACM SIGIR Conference on Research on and developmentininformation retrieval,题目为Query expansion using lexical -semanticrelations (该文作者是Voorhees E.),该文提出了基于本体的查询扩展的方法,使用了本体中的概念进行查询扩展,并得出最有效的扩展方式是利用本体中的同义概念和父子关系进行扩展的结论。在2000年中国出版的期刊计算机工程,题目为本体论与信息检索(该文作者是廖明宏),该文对概念化和本体论进行了比较,试图对本体论做形式化的描述,并在此基础上讨论了基于本体论的信息检索方法。在2003 年加拿大出版的会议论文集!Proceedings of the IstInternationalWorkshop on Adaptive Text Extraction and Mining,题目为An analysis ofontology-based query expansion strategies (该文作者是Navigli R. , Velardi P.),该文提出了基于本体注释的查询扩展方法。该方法假定了在本体中相似的概念或术语也具有相似的定义,使用了 WordNet扩充了本体中概念的注释。在计算扩展概念之间的相似度时,根据概念注释中出现的单词或短语统计计算概念的相似度。在2004 年美国出版的期刊Behavior Research Methods, Instruments,& Computers, 题目为Semantic distance norms computed from anelectronicdictionary (wordnet)(该文作者是Maki ff. , McKinley L. , Thompson A.),该文提出了基于本体结构的扩展方法,基本的思想是利用本体中的结构图来进行查询的扩展。在本体的结构图中,概念的节点之间有着连通的路径,对用户查询内容进行扩展的时候,可以选择与该概念节点连通的路径上的概念。在2005年中国出版的期刊南京大学学报,题目为基于本体的信息检索模型研究(该文作 者是宋峻峰,张维明,肖卫东,唐九阳),该文提出的基于本体的信息检索模型采用了描述逻辑作为本体的描述语言,使用本体中定义的词汇来标记文档,生成基于本体的文档逻辑视图和用户信息需求逻辑视图,从而实现语义层次的检索,使检索性能有所改盡口 o近几年,有些学者开始在基于本体的查询扩展中引入了事件的思想。在2005年中国香港出版的会议论文集!Proceedings of the 2005 IEEEInternational Conference one-Technology, e-Commerce and e-Service,题目为Event_based ontology design forretrieving digital archiveson human religious self-help consulting(该文的作者是Lin H.F.,LiangJ.M.),该文提出了一种称为“事件本体”的检索技术。该本体的顶层概念为事件的要素(如地点、时间等),将事件的构成要素作为该本体中的主要分类,在检索的时候可以按事件要素对查询词进行扩展。在2007年中国出版的会议论文集Proceedings of the 2007IEEEInternational conference on natural language processing andknowledgeengineering,题目为!Reconstruction of people information based onanevent ontology (该文的作者是Han Y.),该文提出了一种基于事件的人物本体模型,他认为可以根据人物之间的关系构造本体,同时人物会关联一些特定的事件,事件可以作为人物的一类属性。可见,基于本体的信息检索已经有了很多研究成果,对事件的检索也已经引起了一些学者的注意。但已有的本体在查询扩展中的应用仍然是以传统的概念本体为基础。事件是关联了时间、地点、人物等多个要素,比概念更大的语义资源,事件本体是共享的客观存在的事件类系统模型的明确的形式化规范说明,以事件本体为语义资源的查询扩展技术有待研究提出。
技术实现思路
本专利技术要解决的技术问题是针对现有技术的不足,提供,该方法基于已有的事件本体语义资源进行查询扩展,能提高事件类信息查询的准确率。为了解决上述问题,本专利技术采用下述技术方案,其具体步骤如下(I)、在指定的查询框中分别输入查询事件的触发词、时间、地点、人物四个要素;(2)、对输入的时间要素的格式进行规整,统一规整为〈年,月,日〉三元组的形式;(3)、对输入的地点要素依据地点本体进行扩展;(4)、根据输入的查询事件的触发词,判断查询事件所属的事件本体的领域;(5)、选取特定领域的事件本体进行查询扩展;(6)、计算查询项与文本的相似度,获取的结果文本按照相似度的大小降序排列输出。上述步骤(3)中所述的对权利要求1.,其特征在于,其具体步骤如下 (1)、在指定的查询框中分别输入查询事件的触发词、时间、地点、人物四个要素; (2)、对输入的时间要素的格式进行规整,统一规整为〈年,月,日〉三元组的形式; (3)、对输入的地点要素依据地点本体进行扩展; (4)、根据输入的查询事件的触发词,判断查询事件所属的事件本体的领域; (5)、选取特定领域的事件本体进行查询扩展; (6)、计算查询项与文本的相似度,获取的结果文本按照相似度的大小降序排列输出。2.根据权利要求I所本文档来自技高网
...

【技术保护点】
一种基于事件本体的查询扩展方法,其特征在于,其具体步骤如下:(1)、在指定的查询框中分别输入查询事件的触发词、时间、地点、人物四个要素;(2)、对输入的时间要素的格式进行规整,统一规整为三元组的形式;(3)、对输入的地点要素依据地点本体进行扩展;(4)、根据输入的查询事件的触发词,判断查询事件所属的事件本体的领域;(5)、选取特定领域的事件本体进行查询扩展;(6)、计算查询项与文本的相似度,获取的结果文本按照相似度的大小降序排列输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:仲兆满李存华陈宗华陈永江管燕
申请(专利权)人:淮海工学院江苏金鸽网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1