一种基于语义索引的检索方法技术

技术编号：6994851 阅读：317 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种基于语义索引的检索方法，包括下列步骤：10)提取用户请求的候选动宾结构并进行筛选，获得合法动宾结构；20)匹配所述合法动宾结构和文档的动宾结构，其中所述文档的动宾结构是对文档进行提取并筛选所获得。上述检索方法，更精确地理解了用户的目的，有效提高了检索的查准率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据检索领域，更具体地，涉及一种基于语义索引的数据检索方法。
技术介绍
基于计算机系统的文档搜索处理器(即搜索引擎)已广泛地用于对互联网上的文档执行关键词搜索。用关键词在网络上进行搜索，固然会给用户提供很大帮助，具备较高的价值，但该方法本身也存在着一个先天的不足，以至于在很大程度上影响着这种价值的发挥。具体地说，由于网络上的可用信息是海量的，而关键词搜索仅仅依据关键词匹配就将所得到的结果提交给了用户，以至于产生了大量的下载信息，这其中的绝大多数是与用户所想要的信息无关的或不重要的。基于关键词检索方法所存在的问题在科学
也广泛地存在。随着越来越多的研究机构、大学、图书馆、专利部门以及其他可供网络访问的技术和科学信息的增加，该问题显得尤为严峻。科研人员被太多的报章、专利以及关于他们所感兴趣的主题的一般性信息所淹没。与之形成巨大的反差的是，在实际查询中，用户所需要的仅仅是和某一特定请求相关的若干篇文章。面对上述查准率较低的情况，用户在检查检索结果以确定其与用户查询的相关性时目前只有两个选择——一种选择是读取摘要，另一种是浏览全文以确定是否保存或打印出该检索到的文章。而实际上，由于很多摘要并不全面，所以其常常不能反映出用户真正感兴趣的特定主题或以不全面的方式论述该主题。因此，浏览摘要可能几乎没有价值。而浏览全文则需要用户花费过多的时间。目前已有多种尝试，试图提高搜索的查准率，但这些方法仅仅依赖于基于关键词的变化或所谓短语理解的各种技术进行的关键词或短语搜索，其仍然需要用户耗费太多的精力和时间来确定真正需要的文档...

【技术保护点】
１．一种基于语义索引的检索方法，包括下列步骤：１０）提取用户请求的候选动宾结构并进行筛选，获得合法动宾结构；２０）匹配所述合法动宾结构和文档的动宾结构，其中所述文档的动宾结构是对文档进行提取并筛选所获得。

【技术特征摘要】

【专利技术属性】
技术研发人员：高建忠，赵琦，王永刚，范祝满，
申请(专利权)人：安世亚太科技北京有限公司，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人