【技术实现步骤摘要】
【国外来华专利技术】
本专利技术通常涉及用于分析大型有向图的改进技术。更具体地说,本专利技术 涉及用于减少向在诸如万维网或者任何其它超媒体数据库之类的大型链接数 据库中的节点分配排级的计算复杂度的方法。
技术介绍
链接数据库(即,包含相互引用'的文档的任何数据库,诸如万维网或者其它超^^某体归档)可以被表示为N节点的有向图,其中每个节点对应于一个文 档,而且其中在节点之间的有向连接对应于从一个文档到另一个文档的有向 链接。 一个给定节点具有一组将它连接到子节点的前向链接,以及一组将它 连接到父(pa ren t)节点的后向链接。排级或者向节点分配重要值经常是有用的。例如,可以通过依据所检索 文档的排级对所检索文档进行排序、并且首先给出最重要的文档,来改善数 据库搜索结果的相关性。 一种进行排级的方法是依据文档的内部内容、或者 根据它的父文档的标记文本(anchor text)来确定排级。当数据库具有数百万 或者数十亿个节点时,但是这种方法变得在计算上是不可实现的。另一种更 有效的方法是依据在节点之间的外在关系,即依据有向图的链接结构来确定 排级。这类方法被称为基于链接的排级。例如,美国专利第6,285,999号公 开了由Google搜索引擎使用的、用于向网页分配排级的基于链接的排级技 术。页面排级(page rank)是页重要性的尺度,其递归地定义为它的父文档的 排级的函数。考虑另一种方法,网页的排级是网络沖浪者在随机地沿着大量 链接之后到达该页面的稳态概率。因此,如果页面具有许多父链接,或者如 果它的父本身具有较高的排级,则它将倾向于具有较高的排级。通过查找N x N链接矩 ...
【技术保护点】
一种用于在链接数据库中计算排级的方法,该方法包含:获得与在链接数据库中的选定节点子集相关联的局部排级向量,其中局部排级向量的每个分量表示在该选定节点子集中的节点的局部排级;获得与链接数据库相关联的块排级向量,其中块排级向量中的每个分量表示在链接数据库中的节点子集的块排级,其中所述子集是由在链接数据库中的节点的划分所定义的多个节点子集之一;选择块排级向量的分量,该分量对应于所选择的节点子集;选择局部排级向量的分量,该分量对应于在选择节点子集中的选定节点;将块排级向量的选定分量和局部排级向量的选定分量组合起来,以获得用于选定节点的全局排级。
【技术特征摘要】
【国外来华专利技术】US 2003-3-28 60/458,921;US 2003-8-22 10/646,3311、一种用于在链接数据库中计算排级的方法,该方法包含获得与在链接数据库中的选定节点子集相关联的局部排级向量,其中局部排级向量的每个分量表示在该选定节点子集中的节点的局部排级;获得与链接数据库相关联的块排级向量,其中块排级向量中的每个分量表示在链接数据库中的节点子集的块排级,其中所述子集是由在链接数据库中的节点的划分所定义的多个节点子集之一;选择块排级向量的分量,该分量对应于所选择的节点子集;选择局部排级向量的分量,该分量对应于在选择节点子集中的选定节点;将块排级向量的选定分量和局部排级向量的选定分量组合起来,以获得用于选定节点的全局排级。2、 如权利要求l所述的方法,其中,获得局部排级向量包含从计算了 局部排级向量的计算机接收局部排级向量。3、 如权利要求l所述的方法,其中,获得局部排级向量包含选择先前 存在的全局排级向量的分量。4、 如权利要求l所述的方法,其中,获得局部排级向量包含形成局部 链接矩阵以及从该局部链接矩阵中计算该局部排级向量,其中该局部链接矩 阵包含在所选择子集的节点之间的链接权重。5、 如权利要求l所述的方法,还包含将链接数据库中的节点分类为主 题类别,并且依据该主题类别将节点的划分创建为多个子集。6、 如权利要求l所述的方法,还包含获得与多个子集相关联的多个局 部排级向量。7、 如权利要求l所述的方法,其中,获得块排级向量包含形成用于链 接数据库的简化链接矩阵,并且从该筒化链接矩阵中计算块排级向量。8、 如权利要求7所述的方法,其中,形成所述简化链接矩阵包含使用一 组与子集相关联的偏爱权重来改变所述简化链接矩阵的元素,以便依据该偏 爱权重定制块排级向量。9、 如权利要求l所述的方法,还包含使用迭代的、基于链接的排级技 术从该全局排级中计算最终排级。10、 如权利要求l所述的方法,还包含使用全局排级来确定在其它节点当中所选择节点的呈现次序。11、 一种用于计算在链接数据库中的节点的排级值的方法,该方法包含 依据节点的类别将链接数据库的节点划分为K个子集;为K个节点子集计算K个局部排级向量; 从K x K简化链接矩阵中计算块排级向量;从局部排级向量和块排级向量中计算全局排级向量;以及 选择对应于该节点的全局排级向量的分量,以获得用于该节点的排级值。12、 如权利要求11所述的方法,其中,计算K个局部排级向量包含将 用于链接数据库的链接矩阵布置为对应于将节点划分为子集的块对角线形 ...
【专利技术属性】
技术研发人员:塞潘达D坎瓦尔,泰尔H哈夫利瓦拉,格伦杰,吉恩戈拉布,
申请(专利权)人:小利兰斯坦福大学理事会,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。