【技术实现步骤摘要】
【国外来华专利技术】在搜索结果排序中对垃圾的检测背景计算机用户具有不同的方式来定位可以本地或远程存储的信息。例如,搜索引擎可以被用来使用搜索查询来定位文档。搜索引擎尝试基于特定搜索查询来返回相关结果。概述提供本概述是为了以精简的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。各实施例被配置成使用垃圾简档来排序搜索结果。在各实施例中,可以计算诸如垃圾分数之类的排序特征,并且排序特征被排序算法用来响应于搜索查询来排序候选文档。在一个实施例中,创建索引,以促进响应于搜索查询对候选文档的标识。在各实施例中, 通过消除或分开地索引当创建文档时可能已经被自动地插入的文档数据来优化索引。在各实施例中,可以通过确定一个文档和已知垃圾文档之间的相似度来进一步计算文档的垃圾分数。在各实施例中,垃圾分数基于该文档的直方图与已知垃圾文档的直方图的比较。直方图可以基于诸如词频和块大小之类的不同的垃圾变量。在各实施例中,可以基于计算出的垃圾分数,将搜索结果标识为可能的垃圾文档,不管搜索结果是否是基于垃圾分数来排序 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:V·坦科维奇,D·梅耶泽,V·波兹南斯基,
申请(专利权)人:微软公司,
类型:
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。