基于通用形式化本体的领域本体的检索方法及装置制造方法及图纸

技术编号:16529076 阅读:52 留言:0更新日期:2017-11-09 20:51
本发明专利技术实施例提供一种基于通用形式化本体的领域本体的检索方法及装置,属于信息检索领域。该方法包括:获取用户的查询请求;对所述查询请求进行预处理,获得初始关键词集;基于预先利用通用形式化本体创建好的领域本体及本体概念模型,获取与所述初始关键词集中的初始关键词匹配的目标搜索概念;获取与所述目标搜索概念对应的检索关键词集;通过所述检索关键词集中的检索关键词进行检索;返回检索后的检索结果。本发明专利技术通过预先利用通用形式化本体来构建领域本体,然后基于目标搜索概念来进行检索,可以更为高效和准确的提供设计领域的知识检索,提高了检索的查全率和查准率。

【技术实现步骤摘要】
基于通用形式化本体的领域本体的检索方法及装置
本专利技术涉及信息检索领域,具体而言,涉及一种基于通用形式化本体的领域本体的检索方法及装置。
技术介绍
传统的全文检索系统中,大多以关键词匹配为主来完成查询条件与索引内容的匹配,但是由于用户输入语句的随机性较强,导致查询条件与索引内容在表达上的差异很大,查询匹配的准确率不高,检索经常出现遗漏重要信息和返回大量不相关结果的现象。即使对关键字建立索引表,可以提供查询效率和查询速度。但是当需要对文献资料进行全文检索的时候,这种数据库的索引方式是不起作用的。如果对全文进行基于关键字,即以匹配“keyword”的方式进行检索,仅能从字面上完成检索请求与索引的匹配,缺乏对检索请求的语义层面的理解与分析能力,其性能和效率是很低的。在召回率和准确率方面无法得到满意的结果。所以,目前的大多数信息检索系统,面对海量的异构化的数据资源,在执行过程当中很难达到在兼顾查全率和准确率的情况下提供高效的全文信息检索。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种基于通用形式化本体的领域本体的检索方法及装置,以改善上述问题。第一方面,本专利技术实施例提供了一种本文档来自技高网...
基于通用形式化本体的领域本体的检索方法及装置

【技术保护点】
一种基于通用形式化本体的领域本体的检索方法,其特征在于,所述方法包括:获取用户的查询请求;对所述查询请求进行预处理,获得初始关键词集;基于预先利用通用形式化本体创建好的领域本体及本体概念模型,获取与所述初始关键词集中的初始关键词匹配的目标搜索概念;获取与所述目标搜索概念对应的检索关键词集;通过所述检索关键词集中的检索关键词进行检索;返回检索后的检索结果。

【技术特征摘要】
1.一种基于通用形式化本体的领域本体的检索方法,其特征在于,所述方法包括:获取用户的查询请求;对所述查询请求进行预处理,获得初始关键词集;基于预先利用通用形式化本体创建好的领域本体及本体概念模型,获取与所述初始关键词集中的初始关键词匹配的目标搜索概念;获取与所述目标搜索概念对应的检索关键词集;通过所述检索关键词集中的检索关键词进行检索;返回检索后的检索结果。2.根据权利要求1所述的方法,其特征在于,基于预先利用通用形式化本体创建好的领域本体及本体概念模型,获取与所述初始关键词集中的初始关键词匹配的目标搜索概念,包括:基于预先利用顶层本体创建好的领域本体及本体概念模型来对所述初始关键词集中的初始关键词进行本体语义扩展,以获得与所述初始关键词匹配的目标搜索概念。3.根据权利要求1所述的方法,其特征在于,通过所述检索关键词集中的检索关键词进行检索,包括:将所述检索关键词集中的检索关键词生成对应的查询语句;通过所述查询语句对预先建立的索引库进行检索。4.根据权利要求3所述的方法,其特征在于,所述获取用户的查询请求的步骤之前,还包括:获取网络中的电子文档;对所述电子文档中的关键词进行标注;对标注后的关键词建立索引库。5.根据权利要求1-4任一所述的方法,其特征在于,领域本体为中医药领域本体。6.一种基于通用形式...

【专利技术属性】
技术研发人员:龙海
申请(专利权)人:长沙沃本智能科技有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1