【技术实现步骤摘要】
本专利技术涉及一种文档链接的方法、设备和系统,特别涉及一种用于在企业内部网中将企业文档链接为虚拟万维网的、基于聚类集合的方法、设备和系统。
技术介绍
进行搜索是从万维网以及企业网络获得有用信息的最普遍的方式。对于网页搜索来说,最知名且有效的方法就是Google的PageRank(网页级别)方法,其在万维网的大量网页中,通过超级链接来计算网页的重要性。网页级别算法的主要原理是,如果许多网页指向同一个网页,则表示这个网页是好网页;另一方面,如果一个重要的网页引用另一个网页,则所述另一个网页也是重要的。在Google搜索引擎中已经使用了PageRank方法,而且已经证明Google搜索引擎是目前最好的搜索引擎。PageRank方法是由Google的创始人LarryPage和Sergey Brin于1998年在斯坦福大学时专利技术的,并且已经获得了美国专利No.6,285,999。PageRank算法的一个替换方法是由Jon Kleinberg提出的HITS算法。HITS提出了两种类型的网页,一是目录型网页(hub page),指包含大量同一主题链接的网页;二是权威型 ...
【技术保护点】
一种用于链接文档的方法,包括步骤:形成多个聚类集合,其中每个聚类集合由一个或多个文档组成;为每个聚类集合创建聚类列表页,以表示该聚类集合中的文档;以及根据对所述聚类集合和文档内容的分析来构建链接。
【技术特征摘要】
【专利技术属性】
技术研发人员:张俐,杨力平,刘世霞,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。