当前位置: 首页 > 专利查询>复旦大学专利>正文

一种表达关系型在线分析处理系统元数据的方法技术方案

技术编号:2865364 阅读:237 留言:0更新日期:2012-04-11 18:40
本发明专利技术为一种ROLAP系统中元数据的表达方法。它采用XML文档来表示ROLAP系统中的元数据。其中,Schema表示整个元数据信息的根节点,Dimension  Specification表示一个维度信息,Level  Specification表示一个维度的所有的级别,Property  Specification表示一个级别的属性,CubeSpecification表示一个多维数据集合,Outer  Dimension  Specification表示一个外部维度,Measure  Specification表示度量。本发明专利技术方法具有很强的表达能力,很大的伸缩性和高度的可移植性。

【技术实现步骤摘要】

本专利技术属数据仓库
,具体涉及一种ROLAP系统中元数据表达方法。
技术介绍
传统的数据库技术是以数据库为中心进行操作型处理,主要是指对数据库联机事务处理(On-Line Transaction Processing,缩写为OLTP)。通常是对一个或一组记录的查询和修改,面对企业的特定应用服务的,人们关心的是响应时间、数据安全性和完整性。随着信息的不断扩增,人们所需要的不仅仅是简单的事务处理,更多是汇总乃至决策信息。在日常实际决策过程中,决策者需要的信息数据往往不只是单一的某个指标数值,而是要能够从多个角度观察某个指标或多个指标的数值,并能发现各指标之间的关系。比如某个公司总经理可能想知道“本公司最近两年在销售旺季(第三季度)销售总额的对比情况,用以决策今年旺季的产品进货等有关事宜”。这是一个非常实际的问题。决策者所需要的数据总是与一些统计指标如销售额,销售产品,销售地区,销售时间等统计有关。这些观察数据的角度称之为维,这些统计数据是多维数据,在多维数据上进行分析是决策的主要内容。传统的数据库很难适应这种决策分析。近几年新兴起来的一门在线分析处理(On-Line AnalyticalProcessing,缩写为OLAP)软件技术,是专门用于支持复杂分析操作的,它以一种直观易懂的饼图、曲线图、直方图等形式将查询结果提供给决策人员,侧重于对决策及管理人员的决策支持。 目前,存在三种OLAP的体系结构ROLAP、MOLAP和HOLAP。ROLAP(RationalOLAP,关系型在线分析处理)体系结构充分利用了目前已有的关系数据库来存储、查询多维数据,具有较强的伸缩性。而MOLAP体系结构采用了多位数组技术存储数据,并对稀疏数据采用压缩技术处理,提供切片、切块和旋转等分析操作。这种体系结构的缺点是,当分析需求变化时,数据结构需要物理的重新组织,以便适应用户需求变化,这提高了建立和维护数据的困难、费用,系统复杂性也相应提高。而HOLAP体系结构集成了ROLAP的可伸缩性和MOLAP的快速计算的特点,将大量的详细数据存放在RDB中,聚集数据存放在MOLAP中,从而提高系统的性能。但是,同时,这种体系结构的缺点也同样明显,就是比较复杂。
技术实现思路
本专利技术的目的在于提出一种具有较强的可伸缩性、高度的可移植性的表达ROLAP系统元数据的方法。 对于ROLAP系统而言,合理表示元数据是一项核心技术。下面首先介绍ROLAP系统元数据的内容,然后再具体介绍如何表示这些元数据。 一个ROLAP系统至少包含四类元数据,即多维数据集合、维度、级别、度量。下面介绍这些元数据。 多维数据集合(Cube)多维数据集合是ROLAP中的主要对象,是一个数据集合,可以对数据仓库中的数据进行快速访问。多维数据集内的单元位置由各维度成员的交集确定,通过对度量值进行聚合得到单元中的值。 维度(Dimension)维度是分类的有组织的层次结构,它用来描述ROLAP中事实数据表的数据。维度一般描述一类成员的相似集合,用户将基于该集合进行分析多维数据集的基本组件。 级别(Level)级别是维度层次结构的一个元素。级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。级别仅存在于维度内。 度量值(Measure)在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。此外,度量值是所分析的多维数据集的中心值。即,度量值是最终用户浏览多维数据集时重点查看的数字数据。 这些元素之间的关系是 1、一个多维数据集合包括一个或多个维度,一个或多个度量值。其中,维度可以是共享维度,也可以是私有维度。 2、一个维度包括一个或多个级别。 3、一个级别可以包括一个或者多个属性。 ROLAP系数中元数据的表示。 XML文件具备良好的表达能力,因此本专利技术选择使用XML文档来表示ROLAP系统中的元数据,其设计的DTD文档如下 <?xml version=″1.0″?><!ELEMENT Schema(DimensionSpecification*|CubeSpecification*)><!ATTLIST Schema<!-- SIPO <DP n="2"> --><dp n="d2"/>name CDATA#REQUIREDdatasource CDATA#REQUIRED!><!ELEMENT DimensionSpecification(LevelSpecification*)><!ATTLIST DimensionSpecificationhasAll CDATA#REQUIREDtablename CDATA#REQUIREDprimaryKey CDATA#REQUIRED!><!ELEMENT LevelSpecification(PropertySpecification*)><!ATTLIST LevelSpecificationname CDATA#REQUIREDcolumn CDATA#REQUIREDuniqueMembers(true|false)!><!ELEMENT PropertySpecification EMPTY><!ATTLIST PropertySpecificationname CDATA#REQUIREDcolumn CDATA#REQUIREDtype CDATA(Numeric|Boolean|String)!><!ELEMENT CubeSpecification(OuterDimensionSpecification*|DimensionSpecification*|MeasureSpecification*)><!ATTLIST CubeSpecificationname CDATA#REQUIREDfacttable CDATA#REQUIRED!><!ELEMENT OuterDimensionSpecification EMPTY><!ATTLIST OuterDimensionSpecificationname CDATA#REQUIREDsource CDATA#REQUIREDforeignKey CDATA#REQUIRED!><!-- SIPO <DP n="3"> --><dp n="d3"/><!ELEMENT OuterDimensionSpecification EMPTY><!ATTLIST OuterDimensionSpecificationname CDATA#REQUIREDsource CDATA #REQUIREDforeignKey CDATA#REQUIRED!><!ELEMENT MeasureSpecification EMPTY><!ATTLIST MeasureSpecificationname CDATA#REQUIREDcolumn CDATA#REQUIRED!> DTD文档的详细描述如下 (1).Schema 作用是整个元数据信息的根节点。 子节点DimensionSpec本文档来自技高网
...

【技术保护点】
一种ROLAP系统中元数据的表达方法,其特征在于使用XML文档来表示元数据,其DTD文档描述如下:(1).Schema作用:是整个元数据信息的根节点,子节点:DimensionSpecification,Cu beSpecification,属性:name:数据仓库名称datasource:表示这个数据仓库所对应的物理关系数据源;(2).DimensionSpecification作用:表示一个维度信息,子 节点:LevelSpecification,属性:name:维度名称,tablename:这个维度所对应的关系表,primaryKey:这个维度所对应的tablename的主键;(3).LevelSpecif ication作用:表示一个维度的所有的级别,子节点:PropertySpecification,属性:name:级别名称,column:这个级别所对应的维度表的字段,UniqueMember:这个级 别中的成员是否是唯一的;(4).PropertySpecification作用:表示一个级别的属性,子节点:无,属性:name:属性名称,column:这个属性所对应的关系表的字段,type: 属性的类别,可分为字符串类型,数字类型;(5).CubeSpecification作用:表示一个多维数据集合,子节点:OuterDimensionSpecification,DimensionSpecific ation,MeasureSpecification,属性:name:多维数据集合名称,facttable:事实表名称;(6).OuterDimensionSpecification作用:表示一个外部 维度,子节点:无,属性:name:维度名称,source:外部维度的名称,foreignKey:外键,对应于一个多维数据集合的字段;(7).MeasureSpecification作用:表示一 个度量,子节点:无,属性:name:名称,column:这个度量所在的字段名称。...

【技术特征摘要】

【专利技术属性】
技术研发人员:金澈清周傲英
申请(专利权)人:复旦大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1