用于联机分析处理的方法和系统技术方案

技术编号:2858599 阅读:191 留言:0更新日期:2012-04-11 18:40
公开了一种用于产生被包含在数据库中的数据记录的用户定义的枢纽视图的方法和系统,其中,如图2a所示,底层真实事实表首先被以连续的索引值(200)扩展,连续索引值提供了所述事实的从“1”到“x”(在本例中x=20)的连续的编号。在图2b中所示的结果枢纽视图中,这些事实的索引被在每个单元(210)中呈现,它的销售值必须被在相应的单元中被总计。借助于序列向量产生所述的枢纽视图。图2c中给出了图2b中的枢纽视图的底层序列向量,并且该向量包括两个列(260、270),左边的列(260)包括从“1”到“x”的连续数字,并且右边的列(270)包括图2a中以有序的排列示出的所提到的索引值(275),该有序的排列使得能够顺序地建立图2b的枢纽视图。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般地涉及由计算机执行的数据库管理系统,尤其是涉及相应的OLAP(联机分析处理)和数据仓库应用。更具体地,本专利技术涉及一种方法和系统,用于产生被包含在这样的数据库管理系统内的数据记录的用户定义的呈现或视图。更具体地,本专利技术涉及具有非常大量数据记录的数据库管理系统。
技术介绍
数据仓库和联机分析处理(OLAP)应用强调需要快速的方法来存储和检索多维数据。数据仓库是企业的各种商业系统收集的全部数据或这些数据的重要部分的中央储存库。有时使用术语“信息仓库”来取代它。典型地,数据仓库被安置在企业的主机服务器上。来自各种联机事务处理(OLTP)应用和其它源的数据被有选择地提取出来并被组织在数据仓库数据库上以便由分析应用和用户查询使用。数据仓库存储强调为了有用的分析和访问从不同源捕捉数据,但是一般不从可能需要访问专门化的、有时是本地数据库的终端用户或知识工作者的角度出发。后一种技术通常被称为数据商场,数据挖掘、Web挖掘和决策支持系统(DSS)是可以使用数据仓库的3种类型的应用。OLAP是使得用户可以容易地和有选择地从不同角度提取和观看数据的计算机处理。例如,用户可以请求对数据进行分析以便显示电子表格,该电子表格示出一个电信公司在当年特定月份内在一个国家里销售的所有移动电话产品,将收入数字与以前月份中的同样产品的收入数字进行比较,并且然后查看在该国家内在同一时间段内的其它产品销售的比较。为了便于完成这种分析,OLAP数据被存储在多维数据库内。关系型数据库可以被想象为是两维的,而多维数据库可以将每个数据属性,通常被称为“数据键”,诸如产品、地理销售区域和时间段作为单独的“维度”考虑。OLAP软件可以定位维度的交集,例如“在某个时间段内在东部区域内以高于某个价格销售的所有产品”,并且显示它们。诸如时间段的属性可以被分解为子属性。与数据仓库类似,OLAP可以被用于数据挖掘或发现数据项之间以前未认识到的关系。由于不是全部的事务数据都需要进行趋势分析,所以OLAP数据库不必象数据仓库那样大。使用开放数据库连接(ODBC),数据可以被从已经存在的关系型数据库中导入,以便为OLAP创建多维数据库。如上所述,OLAP功能主要由支持终端用户的分析和导航活动的对合并数据的动态多维分析确定,包括-跨维度、贯穿分层和/或跨成员地应用的计算和建模;-在连续的时间段上进行的趋势分析;-为屏幕上的查看划分子集;-对合并的更深层次的钻研;-对底层的详细数据的研究;和-在查看区域中枢纽到新的维度比较。OLAP通常被实现在多用户客户机/服务器环境中,并且试图提供对数据库访问的一致地快速响应,而不论数据库的大小和复杂程度是怎样的。由这种数据库访问递送的数据共同地被以底层数据库的部分或甚至是整个内容的交叉表或枢纽(pivot)呈现或视图的方式呈现给终端用户,底层数据库或视图主要由被呈现的数据记录的单元的布置定义。这种布置,在使用平面计算机监视器的典型情况下,必须是两维的。枢纽呈现的另一个例子是被提供在计算机存储器、数据库之类内的二维数据数组。如图1所示,底层数据库的每个数据记录由若干数据属性或数据键构成,其中同样地,数据记录的维度以及因此整个数据库的维度由数据键的数目确定。一个特定的枢纽呈现通常依赖于预先指定的用户对例如顾客信息、被卖给这些顾客的相应商品和销售每件商品的时间的数据记录内容的特定的键布置的偏好。因此通常需要将不同数据记录的内容或给定的数据记录的数据键元素汇总到所述枢纽呈现的单元中。存在有多种用于产生多维数据库中的数据记录的枢纽呈现的方法。第一种方法是使用公知的简单查询语言(SQL)以便通过数据库查询获得已经存在的数据库的用户定义的枢纽视图。但是因为存储在数据库中的所有数据记录都必须被访问以便检查它们是否满足底层查询条件,所以在大型数据库中枢纽视图的计算需要相当多的处理资源。作为第二种方法,存在有公知的OLAP软件工具,其中数据记录被在内部使用超立方体数据结构处理,因此需要大量的存储容量以便存储内部产生的OLAP信息。根据第三种方法,上面讨论的第一种和第二种方法被结合以便提供一种相应的混合概念。但是目前所述的第三种方法也有缺点,因为其性能会产生相当大的变化并且极其依赖于实际的枢纽呈现。
技术实现思路
因此本专利技术的一个目的是提供一种以计算机实现的方法和系统,用于产生被包含在数据库管理系统内的数据记录的用户定义的n维矩阵呈现或视图,所述的方法和系统更加高效,并且因此与根据现有技术的方法相比执行得更快,并且避免了上面所述的现有技术的方法的缺点。本专利技术的另一个目的是提供一种相应方法和系统,所述方法和系统可以被用于具有适当的响应时间的联机分析处理(OLAP)环境中。本专利技术的再一个目的是提供一种相应方法和系统,所述的方法和系统仅需要最少的处理资源用于产生所述的矩阵呈现或视图。由本专利技术的独立权利要求的特征实现了上述目的。从属权利要求的主题是有利的实施例。本专利技术的一个基础思想是以连续的数据序列的方式串行化多维数据库的底层数据记录,多维数据库例如被布置成m维事实表。因此这个序列由优选地是整数的占位符值组成,其中每个这些占位符值被通过参考表或向量链接到底层的未改变的m维事实表。然而,所述矩阵呈现的维度n可以等于所述的维度m。所述的基础机制特别地包括这样的步骤除了作为索引值的记录号之外,将属于有限的数据键的所有数据值字段的内容转换为索引值,并且基于所述的索引值执行用于产生最终矩阵呈现的所有排序步骤,即,所述的整个排序机制或整个排序引擎仅使用这些索引值。应当说明的是,所述n维矩阵呈现的“基数”在示例的二维的情况下的含义是所述二维矩阵的列和行的数目。在多维即,n>=2的情况下,所述基数相应地定义了必要的呈现资源。在优选实施例中,将被在底层矩阵呈现的单个单元,例如,一个二维呈现矩阵的一行中呈现的数据记录被连续地布置在包括各所述占位符值的子序列中。因此使用相应的所述子序列产生所述枢纽呈现的这些单个单元。结果,对于一个单元的枢纽视图,可以使用数据记录的整个序列的一个数据子序列。由所述序列中的开始点具体定义用户指定的枢纽呈现所需的这些单元中的每一个单元,通过所述的开始点访问将被呈现的事实表的所需的数据。使用这样的数据序列产生最终矩阵呈现,从而对n维的事实表的参考仅使用所提到的占位符值。换言之,因此使用虚拟的二维矩阵获得所述矩阵呈现。在优选实施例中,所述的数据序列被以线性向量实现,所述的线性向量包含上面所述的优选地由整数组成的序列。因此,借助于所述的序列向量为各用户定义的枢纽配置对例如被包括在事实表中的每个维度(组)的数据记录进行新的布置。由于使用所述序列向量访问实际的数据记录是这样使用数据记录索引号完成的,所以可以为用户实时地,即,联机地,即,没有任何延迟或仅以非常短的延迟或响应时间地执行被用于特定枢纽呈现的单元,即将被在特定枢纽视图中呈现的列和行的计算。根据本专利技术的另一实施例,底层事实表首先被转换为参考表,基于该参考表产生序列。为了确定数据记录的所述维度中的两个维度之间的转换,在另一实施例中,使用了计数向量。因此根据本专利技术的机制,不需要出于计算可能的枢纽呈现的目的对数据库的数据记录进行预处理,例如,以预先汇总所有的数据记录的方式,这需要相当多的数据处理和本文档来自技高网
...

【技术保护点】
一种用于产生m维数据库的至少一部分的任意的n维矩阵呈现的计算机实现的方法,所述的m维数据库由具有至少一个键维度和至少一个相应的数据值字段的真实数据记录组成,所述方法包括如下步骤:根据所述的n维矩阵呈现,计算所述数据值字段的项的排序序列;为所述n维矩阵呈现的每个维度,计算在所述的排序序列中的相应的项点信息;基于所述的计算出的排序序列和所述的计算出的项点信息,计算所述n维矩阵呈现的基数;基于所述的基数产生所述的任意的n维矩阵呈现,其中基于所述的排序序列和所述的项点信息处理所述的数据值字段。

【技术特征摘要】
EP 2002-10-18 02023362.31.一种用于产生m维数据库的至少一部分的任意的n维矩阵呈现的计算机实现的方法,所述的m维数据库由具有至少一个键维度和至少一个相应的数据值字段的真实数据记录组成,所述方法包括如下步骤根据所述的n维矩阵呈现,计算所述数据值字段的项的排序序列;为所述n维矩阵呈现的每个维度,计算在所述的排序序列中的相应的项点信息;基于所述的计算出的排序序列和所述的计算出的项点信息,计算所述n维矩阵呈现的基数;基于所述的基数产生所述的任意的n维矩阵呈现,其中基于所述的排序序列和所述的项点信息处理所述的数据值字段。2.如权利要求1的方法,其中将所有数据记录的键维度转换为索引值,所述的索引值标注所述键维度的相应键的项的属性,并且其中将已排序的索引值再次转换回所述的真实数据,以便产生所述的任意的矩阵呈现。3.如权利要求2的方法,其中以向量表示一个键维度的所述索引值。4.如权利要求2或3的方法,其中以整数表示所述的索引值。5.如前面任意一个权利要求的方法,包括如下特定的步骤为所述数据库的每个维度产生参考表,所述的参考表仅包括所述的整数值,其中所述的参考表包括每个数据记录的记录标识符,从而保持了所述数据库的维度结构;基于所述的参考表,以标量向量运算基于所述任意矩阵呈现的维度结构产生序列向量;基于所述的参考表,产生计数向量,计数向量提供了被包括在数据记录的所述至少一个维度中的一个维度内的数据记录的数量,从而定义了数据的所述至少一个维度中的不同维度之间的转换;呈现所述数据库的所述任意矩阵呈现,其中使用所述的记录标识符,利用被包含在所述序列向量和所述计数向量中的真实数据,对数据记录的所述至少一个维度进行分组。6.如权利要求5的方法,其中所述的序列向量仅包含整数。7.如前面任意一个权利要求的方法,其中对所述项点信息的计算基于第一块元素(FBE)索引和/或最后一个块元素(LBE)索引...

【专利技术属性】
技术研发人员:帕特里克阿尔拉斯阿尔冯斯坦因霍夫
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1