当前位置: 首页 > 专利查询>咕果公司专利>正文

信息检索系统中基于短语的搜索技术方案

技术编号:6803959 阅读:421 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及信息检索系统中基于短语的搜索。本发明专利技术涉及一种信息检索系统,其使用短语来编制索引、检索、组织并描述文献。识别预测文献中存在其它短语的短语。根据文献中所包括的短语来对文献编制索引。同时识别相关短语与扩展短语。识别并使用查询中的短语来检索文献并对文献分等级。同时使用短语来群集搜索结果中的文献、创建文献说明并从搜索结果与索引中去除重复文献。

【技术实现步骤摘要】
信息检索系统中基于短语的搜索分案申请的相关信息本申请为专利技术名称为“信息检索系统中基于短语的搜索”的原中国专利技术专利申请的分案申请。原申请的申请号为200510085371.5;原申请的申请日为2005年7月26日;原专利技术专利申请案的优先权日为2004年7月26日。相关申请的交叉参考2004年7月26日申请的申请案第10/900,021号“PhraseIdentificationinanInformationRetrievalSystem”;2004年7月26日申请的申请案第10/900,055号“Phrase-BasedIndexinginanInformationRetrievalSystem”;2004年7月26日申请的申请案第10/900,039号“Phrase-BasedPersonalizationofSearchesinanInformationRetrievalSystem”;2004年7月26日申请的申请案第10/900,259号“AutomaticTaxonomyGenerationinSearchResultsUsingPhrases”;2004年7月26本文档来自技高网...
信息检索系统中基于短语的搜索

【技术保护点】
1.一种响应查询而在文献集中选择文献的系统,其包含:存储器,其用于存储基于短语的索引,所述索引包含短语列表以及与所述短语列表中的短语相关联的多个短语记入列表;及一或多个处理器,其用于操作查询处理模块以:接收包括第一短语和第二短语的查询;检索含有所述第一短语的文献的存储的记入列表;为所述记入列表中的每一个文献:存取指示在所述文献中存在的所述第一短语的相关短语的存储的列表,所述第一短语预测所述相关短语中的每一个在所述文献集中的出现;以及响应指示在文献中存在所述第二短语的相关短语列表,选择所述文献将其包括在所述查询的结果中,而不检索含有所述第二短语的文献的记入列表。

【技术特征摘要】
2004.07.26 US 10/900,0411.一种响应查询而在文献集中选择文献的系统,其包含:存储器,其部分功能是用于存储基于短语的索引,所述索引包含短语列表以及与所述短语列表中的短语相关联的多个短语记入列表;及一或多个处理器,其用于操作查询处理模块,所述查询处理模块被包括在所述系统中并且配置用于以:接收包括第一短语和第二短语的查询;检索含有所述第一短语的文献的存储的记入列表,所述存储的记入列表是所述多个短语记入列表中的一个;为所述记入列表中的每一个文献:针对所述文献存取指示在所述文献中存在的所述第一短语的相关短语的存储的列表,其中所述第一短语预测所述相关短语中的每一个在所述文献集中的出现;以及响应于确定指示在所述文献中存在所述第二短语的相关短语列表,选择所述文献并且将所述文献包括在所述查询的结果中,而不检索含有所述第二短语的文献的记入列表。2.如权利要求1所述的系统,其中,当所述相关短语相对于第一短语的信息增益超过预定阈值时,所述第一短语预测相关短语,所述信息增益是实际同时出现率与预期同时出现率的比率。3.如权利要求2所述的系统,其中,当所述相关短语和所述第一短语在所述文献集中的实际同时出现率超过预期同时出现率的度量...

【专利技术属性】
技术研发人员:安娜·林恩·帕特森
申请(专利权)人:咕果公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1