【技术实现步骤摘要】
信息检索系统中基于短语的搜索分案申请的相关信息本申请为专利技术名称为“信息检索系统中基于短语的搜索”的原中国专利技术专利申请的分案申请。原申请的申请号为200510085371.5;原申请的申请日为2005年7月26日;原专利技术专利申请案的优先权日为2004年7月26日。相关申请的交叉参考2004年7月26日申请的申请案第10/900,021号“PhraseIdentificationinanInformationRetrievalSystem”;2004年7月26日申请的申请案第10/900,055号“Phrase-BasedIndexinginanInformationRetrievalSystem”;2004年7月26日申请的申请案第10/900,039号“Phrase-BasedPersonalizationofSearchesinanInformationRetrievalSystem”;2004年7月26日申请的申请案第10/900,259号“AutomaticTaxonomyGenerationinSearchResultsUsingPhrases” ...
【技术保护点】
1.一种响应查询而在文献集中选择文献的系统,其包含:存储器,其用于存储基于短语的索引,所述索引包含短语列表以及与所述短语列表中的短语相关联的多个短语记入列表;及一或多个处理器,其用于操作查询处理模块以:接收包括第一短语和第二短语的查询;检索含有所述第一短语的文献的存储的记入列表;为所述记入列表中的每一个文献:存取指示在所述文献中存在的所述第一短语的相关短语的存储的列表,所述第一短语预测所述相关短语中的每一个在所述文献集中的出现;以及响应指示在文献中存在所述第二短语的相关短语列表,选择所述文献将其包括在所述查询的结果中,而不检索含有所述第二短语的文献的记入列表。
【技术特征摘要】
2004.07.26 US 10/900,0411.一种响应查询而在文献集中选择文献的系统,其包含:存储器,其部分功能是用于存储基于短语的索引,所述索引包含短语列表以及与所述短语列表中的短语相关联的多个短语记入列表;及一或多个处理器,其用于操作查询处理模块,所述查询处理模块被包括在所述系统中并且配置用于以:接收包括第一短语和第二短语的查询;检索含有所述第一短语的文献的存储的记入列表,所述存储的记入列表是所述多个短语记入列表中的一个;为所述记入列表中的每一个文献:针对所述文献存取指示在所述文献中存在的所述第一短语的相关短语的存储的列表,其中所述第一短语预测所述相关短语中的每一个在所述文献集中的出现;以及响应于确定指示在所述文献中存在所述第二短语的相关短语列表,选择所述文献并且将所述文献包括在所述查询的结果中,而不检索含有所述第二短语的文献的记入列表。2.如权利要求1所述的系统,其中,当所述相关短语相对于第一短语的信息增益超过预定阈值时,所述第一短语预测相关短语,所述信息增益是实际同时出现率与预期同时出现率的比率。3.如权利要求2所述的系统,其中,当所述相关短语和所述第一短语在所述文献集中的实际同时出现率超过预期同时出现率的度量...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。