基于农业技术信息本体库的农业专家信息检索系统及方法技术方案

技术编号:12890947 阅读:74 留言:0更新日期:2016-02-18 00:51
本发明专利技术公开了一种基于农业技术信息本体库的农业专家信息检索方法以及系统。所述方法包括:获取自然语言形式的农业技术查询语句;对所述自然语言查询语句进行切分词处理以及地域和领域信息提取以获取检索关键词;根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;在判断所述检索关键词存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集;以及根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。本发明专利技术通过根据具体需求,从检索信息中提取特定领域和地域信息,提高了待检索信息与专家信息的匹配度。

【技术实现步骤摘要】

本专利技术涉及检索领域,具体地,涉及一种。
技术介绍
相对于我国农业生产的规模和特点来说,农业专家的数量难以满足现场解决农业问题的需求,在农业生产中出现的许多问题(如病虫害诊断、种植品种和密度选择、种养殖环境的规划等)难以获得农业专家的技术支持。因此,而针对基层农技人员无法解决的生产实际问题,通过与农业专家进行匹配,推荐出能解决该问题最适合的专家;农技人员获得该领域专家的快速连通,实现农业专家生产动态与技术措施情况信息交流与报送可以为农技人员提供更加有效的农技指导。许多通用搜索引擎,如Google、百度等在一定程度上为信息资源的检索提供了解决方案。但是,一方面通用搜索引擎面向的是所有行业,针对特定行业和特定信息检索准确性和相关性都较差,特别是针对专家人物的检索,效果不理想;另一方面通用搜索引擎采用的是基于关键词的检索技术,只是将分词后的关键词和索引库中的词语进行匹配,无法正确理解和处理用户检索语义和意图,存在着检索结果不准确、无关信息过多等问题。因此,面向农业行业的专家信息检索,利用基于本体的语义检索技术,并通过对检索信息进行领域和地域信息提取,成为提高农业专家信息搜索和匹配效率的有效途径。目前现有技术中提供有一种基于农业技术信息领域本体的智能检索方法。图1是应用该智能检索方法的智能检索系统。如图1所示,该智能检索系统包括:查询接口、查询预处理模块、语义本体推理引擎、传统搜索引擎以及结果返回接口。查询接口获取查询信息,将其发送给查询预处理模块。查询预处理模块分析查询信息,提取领域信息和地域信息,并通过切分词技术,将其切分成查询关键词,并发送给语义本体推理引擎。语义本体推理引擎根据标注本体库中定义的本体概念词汇与概念之间的关系,匹配推理出查询关键词所对应的本体概念词汇,并将其返回给查询预处理模块。查询预处理模块将语义本体推理引擎返回的本体概念词汇发送给传统搜索引擎,并指示传统搜索引擎按照语义搜索。这里所说的按照语义搜索是指在网页已被标注语义的情况下,按照网页标注的语义概念进行字符串匹配,而不是直接对网页自身的内容进行字符串匹配。传统搜索引擎进行语义搜索,并将搜索结果发送给结果返回接口。结果返回接口再将搜索结果返回给用户。现有的技术方案充分利用了领域本体库中的概念及其相互关系,能够正确理解用户需求,优化检索结果,更全、更准地返回专业领域信息。然而,现有技术方案并未涉及对基础数据资源的预处理。一方面基础数据资源中往往含有大量无关的冗余信息,比如网页中往往还有广告、导航、版权等垃圾信息,如果不对这些垃圾信息进行清洗处理,将对后期的检索带来极大噪声干扰;另一方面,网页中包含的都是半结构化数据,真正有用的数据和html标签混合在一起,这也大大降低了检索的精准度。同时,现有技术方案在对用户输入的自然查询语言进行处理时,如果用户输入的自然查询语句中包括本体概念,则进行句型模式的匹配判断,无论匹配成功与否,都是直接对匹配上或进行语义扩展后的本体概念进行查询。由于整个过程缺少用户的参与,而通过对用户输入的自然查询语言进行语义分析并不能完全和精准地理解用户查询意图。并且,由于人物信息检索的特殊性以及农技人员对农业专家的特殊需求,从检索信息中提取特定领域信息、地域信息,有利于检索到更符合要求的专家信息。
技术实现思路
本专利技术的目的是提供一种基于农业技术信息本体库的农业专家信息检索方法以及系统。其中,所述方法通过对网页信息进行清洗和结构化整理以及引入用户交互式参与模式,以及对检索信息进行领域和地域信息的提取,提高了检索的查准率和查全率。为了实现上述目的,本专利技术提供一种基于农业技术信息本体库的农业专家信息检索方法。所述方法包括:获取待查询的自然语言形式的农业技术查询语句;对所述自然语言查询语句进行切分词处理、提取领域信息和地域信息以获取检索关键词;根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;在判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集;以及根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。优选地,所述预设的专家信息索引库包括专家信息全文索引库,所述方法还包括:在判断所述检索关键词中不存在与本体语义概念相关的词汇的情况下,根据所述检索关键词访问所述专家信息全文索引库进行全文检索以生成第一检索结果。优选地,所述预设的专家信息索引库还包括专家信息语义本体索引库,在获得所述本体语义扩展集之后,所述方法还包括:对所述本体语义扩展集进行过滤和权重标识处理;将过滤和权重标识处理后的本体语义扩展集转化为语义查询检索式;以及根据所述语义查询检索式访问所述专家信息语义本体索引库进行检索以生成第二检索结果。优选地,所述方法还包括:根据所述本体语义扩展集的本体词汇权重标识对所述第一检索结果和所述第二检索结果进行排名处理,获得农业专家信息检索最终结果。优选地,建立所述专家信息语义本体索引库和所述专家信息全文索引库包括:读取预设的本体语义资源库中的文本数据;判断所述文本数据中是否存在语义标注信息;在判断所述文本数据中存在所述语义标注信息的情况下,读取所述语义标注信息,并根据所述语义标注信息提取语义概念本体词汇以建立所述专家信息语义本体索引库;以及在判断所述文本数据中不存在所述语义标注信息的情况下,建立包括所述文本数据索引的专家信息全文索引库。优选地,生成所述本体语义资源库包括:从网络中获取农业技术相关信息;对获取信息进行结构化处理以生成农业技术信息资源库;根据预设的农业技术信息本体库标注所述农业技术信息资源库中的资源数据的本体语义;计算标注本体的语义向量空间;将所述语义向量空间中的标注本体词汇与已标注处理的资源数据相关联;以及将所述语义向量空间中的标注本体词汇与已标注处理的资源数据一起存入数据库以生成所述本体语义资源库。相应地,本专利技术还提供一种基于农业技术信息本体库的农业专家信息检索系统。所述系统包括:分词处理单元,用于接收待查询的自然语言形式的农业技术信息语句,并对所述自然语言查询语句进行切分词处理、提取领域信息和地域信息以获取检索关键词;语义本体推理引擎,用于根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;本体语义扩展处理单元,用于在所述语义本体推理引擎判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农当前第1页1 2 3 4 本文档来自技高网
...

【技术保护点】
一种基于农业技术信息本体库的农业专家信息检索方法,其特征在于,所述方法包括:获取待查询的自然语言形式的农业技术查询语句;对所述自然语言查询语句进行切分词处理、提取领域信息和地域信息以获取检索关键词;根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;在判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集;以及根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:李飞飞吴华瑞孙想顾静秋李庆学
申请(专利权)人:北京农业信息技术研究中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1