【技术实现步骤摘要】
本专利技术涉及中文信息检索(IR)领域,特别涉及一种基于领域本体(Domain ontology )的智能检索方法,以及包含该方法的智能检索系统。
技术介绍
信息检索技术的出现是网络发展史上的里程碑,它为网络用户带来了极大的便利, Google、百度是这个领域的典型代表。用户只要输入检索词或检索语句,信息检索系统就会 按照一定的排序规则、为用户快速地返回包含该检索词或检索语句的所有网页。因此,对于 信息检索系统而言,正确理解用户的检索需求、优化结果排序方式等至关重要。然而,现有的通用搜索引擎无法准确理解和处理各类信息,特别是专业领域知识,经常 检索不到、甚至返回大量无关专业领域信息,系统査全率和査准率不高。主要原因在于一方面,采取关键字匹配方式理解用户检索语句。信息检索系统并不关注用户输入的专 业领域词汇的概念和语义,只是将分词后的关键词与索引库中的索引词按照字面形式进行直 接匹配。另一方面,按照检索相关度对结果进行排序处理,即按照检索词和索引词之间相同的字 或词的多少进行排序。为了提高检索效率, 一些信息检索系统提出了 相关搜索等改进技术,然而,这些技 术仍 ...
【技术保护点】
一种基于领域本体的智能检索系统,包括用于分析用户输入自然查询语句的本体推理模块,用于创建索引库的索引处理模块,用于进行特定查询的查询处理模块,以及用于查询结果处理的结果优化排序模块,其特征在于,所述的系统还包括数据资源库、领域本体库和索引数据库;。
【技术特征摘要】
1.一种基于领域本体的智能检索系统,包括用于分析用户输入自然查询语句的本体推理模块,用于创建索引库的索引处理模块,用于进行特定查询的查询处理模块,以及用于查询结果处理的结果优化排序模块,其特征在于,所述的系统还包括数据资源库、领域本体库和索引数据库;2.权利要求l所述的基于领域本体的智能检索系统,其特征在于 ,所述的本体推理模块包括分词预处理单元和句型模式匹配单元;所述分词预处理单元,用于接收用户输入的自然査询语句,对査询语句进行分词、词 性标注、领域本体角色标注等预处理,去除弱语义词汇,得到强语义词汇集合;所述句型模式匹配单元,用于将强语义词汇集合与事先定义的句型模式进行匹配处理 ,得到新的检索式;3.权利要求l所述的基于领域本体的智能检索系统,其特征在于 ,所述的索引处理模块包括本体语义索弓1处理单元和全文索弓1处理单元;所述本体语义索引处理单元,用于获取数据资源文档,解析、处理并提取文档主体内 容信息,基于领域本体库合成语义向量,建立语义本体索引库;所述全文索引处理单元,用于获取数据资源文档,提取文档信息,建立全文索引库;4.权利要求l所述的基于领域本体的智能检索系统,其特征在于 ,所述的査询处理模块包括语义査询处理单元、扩展査询处理单元和全文检索处理单元;所述语义査询处理单元,用于基于领域本体概念及概念间关联进行专业领域信息的智 能査询处理;所述扩展査询处理单元,用于...
【专利技术属性】
技术研发人员:吴来,刘鹏,李春梅,黄道雄,范书德,
申请(专利权)人:北京中机科海科技发展有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。