【技术实现步骤摘要】
【国外来华专利技术】
本说明书一般涉及信息检索。其具体涉及,但决不限于,对文档排序以用于诸如web搜索系统等搜索系统的方法。背景web搜索系统是一类信息检索系统的一个示例,尽管本专利技术是关于任何类型的信息检索系统的。web搜索系统使人们能够找到最适合其要求的网站。使用了三个主要组件来实现这点:web爬行器(crawler);索引生成器;和查询服务器。web爬行器一次爬行一个web链接,并发送所标识的要被索引的网页。这通过利用站点之间的链接来实现。这一web爬行过程可被认为是标识新网站和标识对现有网站的更新的持续过程。爬行过程使数十亿网页能够被标识,且为利用该信息,则需要检索页面的系统方法。索引生成器提供了该方法的一部分。类似于书籍后面的索引,索引生成器标识要与每一网站的内容进行关联的关键字。随后,在搜索这些关键字时,搜索系统可以从数十亿个可用页面中找出最适当的页面。索引生成器包括诸如一个项在页面上使用的频率、页面标题或索引中中所使用的是哪些项等信息以供 ...
【技术保护点】
一种形成供在信息检索系统中使用的文档索引的方法,所述方法包括以下步骤: (i)指定多个字段,包括可以联合每一文档使用的至少一个反馈字段; (ii)访问多个文档,且对于那些文档的每一个,使用来自所访问的文档的信息填充至少某些字段; (iii)接收包括多个查询项、所述文档中特定一个文档哪个的标识符、和关于反馈的类型的信息的反馈信息; (iv)对于所述文档中所述特定一个文档,在关于所述反馈类型的信息的基础上用所述多个查询项来填充反馈字段; (v)在所填 充的字段是基础上形成所述文档的索引; (vi)接收多个查询项; (vi ...
【技术特征摘要】
【国外来华专利技术】EP 2006-6-1 06114850.81.一种形成供在信息检索系统中使用的文档索引的方法,所述方法包
括以下步骤:
(i)指定多个字段,包括可以联合每一文档使用的至少一个反馈字段;
(ii)访问多个文档,且对于那些文档的每一个,使用来自所访问的文
档的信息填充至少某些字段;
(iii)接收包括多个查询项、所述文档中特定一个文档哪个的标识符、
和关于反馈的类型的信息的反馈信息;
(iv)对于所述文档中所述特定一个文档,在关于所述反馈类型的信
息的基础上用所述多个查询项来填充反馈字段;
(v)在所填充的字段是基础上形成所述文档的索引;
(vi)接收多个查询项;
(vii)在所述多个查询项的基础上从所述索引中获得文档统计数据,
并使用搜索算法来生成经排序的文档列表,所述搜索算法适于与多个查询
项和多个文档字段一起使用并被安排成提供对所述字段的差异加权。
2.如权利要求1所述的方法,其特征在于,所述关于反馈类型的信息
包括关于所述反馈是肯定还是否定的信息。
3.如权利要求1或权利要求2所述的方法,其特征在于,所述关于反
馈类型的信息包括关于所述反馈是显式还是隐式的信息。
4.如前述任一权利要求所述的方法,其特征在于,所述指定字段的步
骤包括指定多个反馈字段,每一反馈字段都对应不同类型的反馈。
5.如前述任一权利要求所述的方法,其特征在于,所述形成索引的步
骤包括在所述字段和至少某些反馈字段的基础上生成文档统计数据。
6.如权利要求5所述的方法,其特征在于,所述索引被重复地更新。
7.如权利要求6所述的方法,其特征在于,所述索引被充分频繁地更
新,使得在搜索期间,反馈信息被动态地合并入所述文档中并被用来影响
正在进行的搜索。
8.如权利要求6所述的方法,其特征在于,所述反馈信息被用来影响
查询间搜索。
9.如前述任一权利要求所述的方法,其特征在于,包括在指定的时间
段之后清空所述反馈字段。
10.如前述任一权利要求所述的方法,其特征在于,包括在所流逝的
时间的基础上调整与所述反馈字段相关联的权重。
11.如前述任一权利要求所述的方法,其特征在于,所述信息检索系
统是图像检索系统且所述文档是图像。
12.一种用于形成供在信息检索系统中使用的文档(11)索引(31)
的装置,所述装置包括:
(i)被安排成指定...
【专利技术属性】
技术研发人员:MJ泰勒,S罗伯逊,HE威廉姆斯,NE克拉斯韦尔,
申请(专利权)人:微软公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。