【技术实现步骤摘要】
本专利技术涉及电子文档的搜索,更具体而言,涉及一种处理搜索结果以便确定搜索结果中的电子文档之间的关系的系统和方法。启用因特网的计算装置(比如,个人计算机(PC)、个人数字助理(PDA)、蜂窝式电话等等)的普及使用是″web搜索″的性能特性。典型地,用户在计算装置上运行Web浏览器程序并运用Web浏览器在因特网上访问远程服务器上的搜索引擎。搜索引擎的用户界面往往是具有文字框的web页面,在所述文字框中,用户可以输入一个关键词或一系列关键词。一旦输入了这些关键词,搜索引擎就准备出一个与那些关键词相关的web页面的列表。通常,搜索引擎实际上不搜索因特网而是搜索索引数据库,在所述索引数据库中保存着与因特网上的web页面相对应的文件。在某些情况下,索引数据库由实际的web页面或web页面的压缩版本组成。一旦已生成相关web页面的列表,搜索引擎的用户界面就向用户展示该列表。附图说明图1示出了用于显示搜索引擎结果的典型web页面用户界面100。在图1中,将结果展示成超文本形式的″链接″150,当用户利用计算装置的光标选择(″点击″或″双击″)链接时,所述超文本形式的″链接 ...
【技术保护点】
一种用于处理搜索结果的方法,其中所述搜索结果是由项组成的电子文档,其特征在于,包括以下步骤:确定搜索结果当中每个电子文档中的每个项的项频率反相文档频率TFIDF(210),其中所述TFIDF是项频率除以文档频率,其中所述项频率是文档 中的特定项的频率,而所述文档频率是特定项在全局文档组上的频率;确定搜索结果中的电子文档之间的相似性度量(220),其中所述相似性度量是以所确定的TFIDF值为基础的;以及根据所确定的相似性度量来组织搜索结果(230)。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:SVR古塔塔,V普希洛明,M特拉科韦,
申请(专利权)人:皇家飞利浦电子股份有限公司,
类型:发明
国别省市:NL[荷兰]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。