【技术实现步骤摘要】
本专利技术涉及一种信息检索加工的方法,尤其涉及一种。
技术介绍
数据信息和文档的有效检索和加工,是数据库应用领域中的核心和重要内容,广泛存在于各种电子数据、文献、商业数据库资源和互联网内容搜索的应用当中。目前这一领域中的数据信息检索技术,一般是基于关键词的统计方法,用关键词的布尔表达式作为查询语句。对于文件数据库,使用关键词加关键词出现在文件中位置的字典,通过比较查询语句的关键词与文件数据库字典中的关键词,找到相应文件。另外,有些改进采用了模糊逻辑模型、向量空间模型和概率检索模型等。在知识处理环节,目前操作都是通过主题词标引、个别关键词标注、文档摘要方式对整篇文档进行属性标识,并作为检索过程中的检索关键词,这种方式不能完全反映整篇文档中的全部知识信息,比如虽然有事实关系,但关键词没有表示,就无法检索出来,最终结果表现为检索结果中的文档缺失。
技术实现思路
为了解决上述存在的问题,本专利技术提供一种,该方法能够解决诸如“隐含指代”等较为复杂的搜索请求。本专利技术通过以下方案实现一种,其步骤为(1)录入原始文件信息,制作关键词加关键词出现在文件中位置的字典;(2)建立 ...
【技术保护点】
一种基于三元模型的信息检索加工的方法,其步骤为: (1)录入原始文件信息,制作关键词加关键词出现在文件中位置的字典; (2)建立三元关系模型,采用三元组Ka、Kr、Kb形式,其中Ka代表关键词a,Kb代表关键词b,Kr代表关键词a和关键词b之间的关系;该三元组形式表示和实现关键词之间的三种类型的关联关系;Kr↓[r]代表关系关键词之间的关系,Kr′代表Kr根据Kr↓[r]推导出的关系,由此Ka′关键词和Kb′关键词具有了新的关系Kr′; (3)将上述三元关系模型中Kr、Kr↓[r]、Kr′录入到检索数据库中; (4)根据步骤(1)中的关键词和步骤(3 ...
【技术特征摘要】
1.一种基于三元模型的信息检索加工的方法,其步骤为(1)录入原始文件信息,制作关键词加关键词出现在文件中位置的字典;(2)建立三元关系模型,采用三元组Ka、Kr、Kb形式,其中Ka代表关键词a,Kb代表关键词b,Kr代表关键词a和关键词b之间的关系;该三元组形式表示和实现关键词之间的三种类型的关联关系;Krr代表关系关键词之间的关系,Kr′代表Kr根据Krr推导出的关系,由此Ka′关键词和Kb′关键词具有了新的关系Kr′;(3)将上述三元关系模型中Kr、Krr、Kr′录入到检索数据库中;(4)根据步骤(1)中的关键词和步骤(3)中的关系自动导出关键词之间的新关系,即Ka′关键词和Kb′关键词的新关系Kr′,并将关...
【专利技术属性】
技术研发人员:赵开灏,文小凡,
申请(专利权)人:赵开灏,文小凡,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。