用于存储和访问互锁树数据仓库中的数据的系统和方法技术方案

技术编号:2852871 阅读:187 留言:0更新日期:2012-04-11 18:40
生成和/或访问由包括互连的树的林所构成的基于树的数据仓库。基于树的数据仓库包括从第一根节点下垂的第一树,并可以包括多个树枝。第一树的每一个树枝都在叶节点中结束(图3c350)。每一个叶节点都可以代表最终产物,或子组件节点。同一个基于树的数据仓库的第二根链接到代表最终产物的每一个叶节点(图3c356)。最后,基于树的数据仓库包括多个树,其中,这些树中的每一个树的根节点都可以被描述为基本节点。这些树中的每一个树的基本根节点都可以链接到第一树的一个或多个树枝中的一个或多个节点(图9a)。基于树的数据仓库的节点只包含指向基于树的数据仓库中的其他节点的指针,并可以包含额外的字段,其中,一个字段可以是计数字段。另外,描述了获取一个或多个定义的焦点内的所需要的上下文所标识的涉及特定节点的变量的一致性的概率的装置。此外,还显示了逻辑运算符对涉及这样的变量的查询的应用。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及计算领域,具体来说,涉及将数据存储在数据仓库中并访问其中的数据的领域。
技术介绍
在开发软件时开发人员所作出的一个基本选择是选择适当的数据结构以便于组织和引用数据。有许多不同类型的数据结构,包括链接列表、堆栈、树、数组及其他。每一个数据结构都与某些优点和局限关联。一个频繁使用的数据结构是树。树的一种常见形式由叫做节点的元素的有限集构成,从根到一个或多个内部节点链接在一起,其中每一个节点都可以链接到一个或多个节点,最终以许多叶节点结束。通常,与根比较近的节点是远离根的节点的父节点。远离根的节点叫做父节点的子节点。数据通常存储在节点中,并可以使用从根到节点到叶和从父节点到子节点的链接来引用。因此,分层或顺序关系可以是存储在树结构的节点中的数据。分层关系也可以被理解为上下文关系,每一个节点都可在其父节点的上下文内被访问。树数据结构的一个局限是,通常,一个树只能代表一个层次结构。例如,销售活动的根节点可以具有许多从根节点下垂的节点,每一个节点都代表特定推销员。每一个销售员节点都可以具有子节点,每一个销售员子节点都代表位于特定州的销售。因此,在销售员的上下文内可以轻松地访问此树,以查找州信息,即,此树可以用来有效地回答问题“销售员Bob在哪个州进行销售?”如果不是按销售员访问州数据,而需求州的上下文内的销售员数据,(即,我们希望回答问题“哪个销售员在得克萨斯州销售?”),则必须创建另一个树,代表州的节点从根销售员活动下垂,代表销售员的子节点可以从该节点中下垂。创建另一个树的替代方法将是遍历整个树,以提取所希望的信息。如果一个结构可以记录数据内的所有可能的上下文关系是有帮助的,从而实现用标准树数据结构无法实现的效率。
技术实现思路
生成和/或访问包括互连的树的林所构成的一个或多个级别的基于树的数据仓库。基于树的数据仓库的每一个级别包括从第一根节点下垂的第一树,并可以包括多个树枝。第一根可以代表诸如但不限于级别开始指示符之类的概念。第一树的每一个树枝都在叶节点中结束。每一个叶节点都可以代表最终产物,如下面比较全面地描述的。基于树的数据仓库的同一个级别的第二根链接到代表最终产物的第一树的每一个叶节点。因此,第二根基本上是第一树或第一树的子集的倒序的根,但第一树不重复。第二根可以代表诸如但不限于级别结束指示符之类的概念。最后,基于树的数据仓库包括多个树,其中,这些树中的每一个树的根节点都可以包括诸如数据集元素或数据集元素的表示法之类的数据。这种根节点这里被称为基本根节点。这些树中的每一个树的基本根节点都可以链接到非复制的第一树的一个或多个树枝中的一个或多个节点。基于树的数据仓库的非根节点只包含指向基于树的数据仓库中的其他节点的指针。包括基于树的数据仓库的每一个级别的树林中的树的根也由指示器组成,然而,根节点也可以包含代表信息的数据(即,包含是或代表诸如数据集元素之类的数据或诸如级别开始或级别结束指示符之类的概念的数据);基于树的数据仓库的所有其他节点只指向其他节点,不包含数据。在本专利技术的一个实施例中,数据是与字符关联的整数,像素表示法、诸如开始指示符、结束指示符、字段指示符的开始等等条件,尽管本专利技术不仅限于此。可以生成和访问上文所描述的基于树的数据仓库的多个级别;较低级别的最终产物变成下一级别的基本根节点。生成和访问互锁树数据仓库。数据仓库包括构成了从第一根下垂的一个asCase树的asCase树枝的多根树,这里叫做主根,asResult树枝构成了从多重根下垂的多个asResult树。asResult树的一个特殊实例包括链接到上文所描述的asCase树的一个或多个最终产物叶节点的根节点。因此,此asResult树可以轻松地按照倒序访问在最终产物中结束的asCase树的树枝。此asResult树也可以用来定义下一级别的基本根节点。这些基本根节点可以代表由较低级别的最终产物集组成的下一级别的数据集元素。互锁树数据仓库可以通过组合代表级别开始指示符的节点和代表数据集元素的节点以构成代表子组件的节点,捕获有关在输入文件中遇到的数据集元素之间的关系的信息。子组件节点可以同代表数据集元素的节点相结合,以生成迭代子进程位于另一个子组件节点。将子组件节点与代表级别结束指示符的节点组合可以创建级别最终产物节点。将级别开始节点与数据集元素节点组合以创建子组件以及将子组件与数据集元素节点组合的过程本身可以迭代,以生成一个级别中的多个asCase树枝。AsResult树还可以通过指向asCase树中的一个或多个节点的asResult树的根,链接或连接到asCase树中的节点。一个级别的最终产物可以是代表数据集元素的基本根节点,它们组合起来以生成子组件的下一级别。此过程可以重复任意次,创建asCase树的任意个级别。另外,还可以分解一个级别的基本根节点以生成较低级别的节点和根。一个级别的最终产物节点,通过较低级别的asResult树的特殊实例,即,具有代表较低级别的结束指示符的根节点的较低级别的的asResult树,变成下一级别的基本根节点。如此,具有代表较低级别的结束指示符的根节点的较低级别的asResult树是第二根,较低级别的asCase树的反转。在本专利技术的一个实施例中,在创建节点时,在每一个级别中基本上同时生成asCase和asResult链接。通过在处理输入时生成asCase链接来创建AsCase树枝。每一个级别上的asCase树的asCase树枝提供是如何通过将代表数据集元素的节点按顺序组合为子组件等等到最终产物,创建级别每一个子组件和最终产物的直接记录。asCase树的树枝还代表树中的节点的一个可能的分层关系。asResult链接的生成创建了一系列互锁树,每一个互锁树都从一个单独的根下垂。在一个级别中可能有多个此类型的根。这具有记录在输入中遇到的数据集元素之间的所有其他关系的结果。如前所述的信息是通过构建的而不是显式存储在树的节点中的互锁树的林的结构来捕获的,以便实际上作为输入接收的数据判断构建的互锁树的林的结构。asResult树的林的结构确保了,可以在需要的任何其他上下文中访问如此存储的信息。因此,数据仓库是自组织的,从下面的描述中就可以看出。另外,将使用用于生成基于树的数据仓库的系统来执行操作,该系统可以具有处理器;连接到处理器的存储器;以及用于创建基于树的数据仓库的至少一个级别的基于树的数据仓库生成器,所述基于树的数据仓库的至少一个级别包括第一树、第二树以及至少第三树,所述第一树中包括第一根和多个节点中的至少一个节点,所述第二树中包括第二根和第一树的至少一个节点,所述第三树中包括第三根和第一树的多个节点中的至少一个节点。优选情况下,为评估来自包括了包含计数字段和所述节点之间的链接的节点的互锁树数据仓库的由互锁树数据仓库表示的数据的集合,所述节点包括根节点,其中,有至少一个主根节点和至少一个基本根节点,并可以包括其他根节点,所述节点还包括至少一个结束思考节点、至少一个子组件节点、以及至少一个最终产物节点,其中,存在asResult和asCase链接,其中,所述asResult链接在根节点和任何其他节点之间的路径中在所述根节点和所述任何其他节点之间提供指向,其中,所述asCase链接在至少一个主根节点和本文档来自技高网
...

【技术保护点】
一种用于生成基于树的数据仓库的系统,包括:处理器;连接到处理器的存储器;以及 用于创建基于树的数据仓库的至少一个级别的基于树的数据仓库生成器,所述基于树的数据仓库的至少一个级别包括第一树、第二树以及至少第三树,所述第 一树中包括第一根和多个节点中的至少一个节点,所述第二树中包括第二根和第一树的至少一个节点,所述第三树中包括第三根和第一树的多个节点中的至少一个节点。

【技术特征摘要】
【国外来华专利技术】US 2003-3-10 10/385,421;US 2003-9-19 10/666,3821.一种用于生成基于树的数据仓库的系统,包括处理器;连接到处理器的存储器;以及用于创建基于树的数据仓库的至少一个级别的基于树的数据仓库生成器,所述基于树的数据仓库的至少一个级别包括第一树、第二树以及至少第三树,所述第一树中包括第一根和多个节点中的至少一个节点,所述第二树中包括第二根和第一树的至少一个节点,所述第三树中包括第三根和第一树的多个节点中的至少一个节点。2.一种评估由互锁树数据仓库表示的数据的集合的方法,所述数据仓库包括含有计数字段的节点和所述节点之间的链接,所述节点包括根节点,其中,有至少一个主根节点和至少一个基本根节点,并可以包括其他根节点,所述节点还包括至少一个结束思考节点、至少一个子组件节点、以及至少一个最终产物节点,其中,存在asResult和asCase链接,其中,所述asResult链接在根节点和任何其他节点之间提供指向,其中,所述asCase链接在至少一个主根节点和至少一个最终产物节点之间提供指向,并且在所述至少一个主根节点和至少一个最终产物节点之间的路径中包含至少一个子组件节点,所述方法包括下列步骤确定所述数据仓库内的上下文以及其对应值;确定所述上下文内的焦点以及其对应值;使用所述上下文和所述焦点的对应值,计算所述上下文内的所述焦点的发生概率。3.根据权利要求2所述的评估数据的集合的方法,其中,所述确定上下文和其对应值的步骤包括下列步骤选择上下文约束列表,所述上下文约束列表包含由所述互锁树数据仓库的至少一个根节点表示的值,其中,所述上下文约束列表上的至少一个根节点的全部都通过逻辑表达式彼此关联;通过从至少一个根节点的asResult列表遍历到至少一个根节点的对应的子组件节点,然后遍历所述对应的子组件节点到所述子组件节点的每一个对应的最终产物节点之间的asCase链接,从所述至少一个根节点,按照最终产物节点,标识一个或多个路径;忽略具有到这样的基本根节点的链接的那些路径,所述基本根节点的值字段不符合所述逻辑表达式,如此构成上下文的结果节点集中只包括沿着没有被忽略的那些路径的节点;以及添加那些没有被忽略的一个或多个路径的最终产物节点的计数,以获取上下文计数。4.根据权利要求2所述的评估数据的集合的方法,其中,所述确定上下文和其对应值的步骤包括下列步骤选择上下文约束列表,所述上下文约束列表包含由所述互锁树数据仓库的至少一个根节点表示的值,其中,所述上下文约束列表上的至少一个根节点的全部都通过逻辑表达式彼此关联;通过沿着所述路径,使用Case链接,从所有可能的最终产物节点反向朝着主根的方向遍历,并且在每一个子组件节点使用其Result链接定位根节点,并将其与所述至少一个根节点进行比较,按照最终产物节点,标识一个或多个路径;忽略具有到这样的基本根节点的链接的那些路径,所述基本根节点的值字段不符合所述逻辑表达式,如此构成上下文的结果节点集中只包括沿着没有被忽略的那些路径的节点;以及添加那些没有被忽略的一个或多个路径的最终产物节点的计数,以获取上下文计数。5.一种评估由互锁树数据仓库表示的数据的集合的方法,所述数据仓库包括含有计数字段的节点和所述节点之间的链接,所述节点包括根节点,其中,有至少一个主根节点和至少一个基本根节点,并可以包括其他根节点,所述节点还包括至少一个结束思考节点、至少一个子组件节点、以及至少一个最终产物节点,其中,存在asResult和asCase链接,其中,所述asResult链接在根节点和任何其他节点之间提供指向,其中,所述asCase链接在至少一个主根节点和至少一个最终产物节点之间提供指向,并且在所述至少一个主根节点和至少一个最终产物节点之间的路径中包含至少一个子组件节点,所述方法包括下列步骤确定所述数据集内的上下文以及其对应值;确定沿着上下文的每一个路径的位置;确定所述上下文内的焦点以及其对应值;计算沿着所述上下文内的路径的所述位置和最终产物之间的所述焦点的发生概率。6.根据权利要求5所述的评估数据的集合的方法,其中,确定沿着上下文的每一个路径的位置的步骤包括下列步骤从所述互锁树数据仓库的根节点或基本根节点中选择一个根节点,从上下文的每一个路径中的所述根节点的或基本根节点的asResult列表遍历到其对应的子组件节点。7.根据权利要求5所述的评估数据的集合的方法,其中,所述确定上下文和其对应值的步骤包括下列步骤选择上下文约束列表,所述上下文约束列表包含由所述互锁树数据仓库的至少一个根节点表示的值,其中,所述上下文约束列表上的至少一个根节点的全部都通过逻辑表达式彼此关联;通过从至少一个根节点的asResult列表遍历到至少一个根节点的对应的子组件节点,然后遍历所述对应的子组件节点到所述子组件节点的每一个对应的最终产物节点之间的asCase链接,从所述至少一个根节点,按照最终产物节点,标识一个或多个路径;忽略具有到这样的基本根节点的链接的那些路径,所述基本根节点的值字段不符合所述逻辑表达式,如此构成上下文的结果节点集中只包括沿着没有被忽略的那些路径的节点;以及添加那些没有被忽略的一个或多个路径的最终产物节点的计数,以获取上下文计数。8.根据权利要求7所述的评估数据的集合的方法,其中,所述确定上下文和其对应值的步骤包括下列步骤选择上下文约束列表,所述上下文约束列表包含由所述互锁树数据仓库的至少一个根节点表示的值,其中,所述上下文约束列表上的至少一个根节点的全部都通过逻辑表达式彼此关联;通过沿着所述路径,使用Case链接,从所有可能的最终产物节点反向朝着主根的方向遍历,并且在每一个子组件节点使用其Result链接定位根节点,并将其与所述至少一个根节点进行比较,按照最终产物节点,标识一个或多个路径;忽略具有到这样的基本根节点的链接的那些路径,所述基本根节点的值字段不符合所述逻辑表达式,如此构成上下文的结果节点集中只包括沿着没有被忽略的那些路径的节点;以及添加那些没有被忽略的一个或多个路径的最终产物节点的计数,以获取上下文计数。9.一种评估由互锁树数据仓库表示的数据的集合的方法,所述数据仓库包括含有计数字段的节点和所述节点之间的链接,所述节点包括根节点,其中,有至少一个主根节点和至少一个基本根节点,并可以包括其他根节点,所述节点还包括至少一个结束思考节点、至少一个子组件节点、以及至少一个最终产物节点,其中,存在asResult和asCase链接,其中,所述asResult链接在根节点和任何其他节点之间提供指向,其中,所述asCase链接在至少一个主根节点和至少一个最终产物节点之间提供指向,并且在所述至少一个主根节点和至少一个最终产物节点之间的路径中包含至少一个子组件节点,所述方法包括下列步骤确定所述数据集内的上下文以及其对应值;确定沿着上下文的每一个路径的位置;确定所述上下文内的焦点以及其对应值;计算沿着所述上下文内的路径的所述位置和主根之间的所述焦点的发生概率。10.根据权利要求9所述的评估数据的集合的方法,其中,确定沿着上下文的每一个路径的位置的步骤包括下列步骤从所述互锁树数据仓库的根节点或基本根节点中选择一个根节点,从上下文的每一个路径中的所述根节点的或基本根节点的asResult列表遍历到其对应的子组件节点。11.根据权利要求9所述的评估数据的集合的方法,其中,所述确定上下文和其对应值的步骤包括下列步骤选择上下文约束列表,所述上下文约束列表包含由所述互锁树数据仓库的至少一个根节点表示的值,其中,所述上下文约束列表上的至少一个根节点的全部都通过逻辑表达式彼此关联;通过从至少一个根节点的asResult列表遍历到至少一个根节点的对应的子组件节点,然后遍历所述对应的子组件节点到所述子组件节点的每一个对应的最终产物节点之间的asCase链接,从所述至少一个根节点,按照最终产物节点,标识一个或多个路径;忽略具有到这样的基本根节点的链接的那些路径,所述基本根节点的值字段不符合所述逻辑表达式,如此构成上下文的结果节点集中只包括沿着没有被忽略的那些路径的节点...

【专利技术属性】
技术研发人员:詹尼坎贝尔马扎加蒂
申请(专利权)人:尤尼西斯公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1