提高数据仓库性能的方法和装置制造方法及图纸

技术编号:5393381 阅读:512 留言:0更新日期:2012-04-11 18:40
公开了用于提高数据仓库性能的方法和装置。一种对从数据仓库所接收的数据进行格式化的示例方法,包括:接收分析指令,基于所述分析指令从所述数据仓库检索数据,以及将映射文件与事实表相关联,该映射文件存储在第一层级目录文件路径中。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术概要地涉及数据格式化和分析,并且尤其涉及提高数据仓库 性能的方法和装置。
技术介绍
各种类型数据的存储、检索和处理允许企业为了优化性能而策划新 的业务计划和/或调整现有的业务计划。例如,无线电话公司可以管理存 储现有用户信息和/或新用户信息的数据仓库。如果该无线公司处理这种 收集到的数据,可能会发现暗示新的市场机会和/或需要恢复和/或附加服 务设备的负担过重的市场的成长趋势。分析在数据仓库中存储的业务数 据可以使公司将这种数据转化为企业智慧,更好地了解他们的客户,和/ 或基于依据经验信息而非试探法来制定各种管理决策。非商业性组织也可以分析仓储的数据以满足各种设计目的。例如, 政府和/或市政部门可以研究人口增长和/或人口流动,以为增加的使用更 好地配备城市基础设施和/或服务。类似地,这种人口趋势分析能够例示 所分配的预算可以从需求较少的城市项目重新拨划到与高人口增长率关 系密切的更优先的项目。数据仓库可以维持用于后序分析的数据的拷贝。数据可以包括人口 数据、财务数据、商业数据、和/或行为数据,比如有线电视订阅、家庭购买行为、和/或广播节目消费。可以按各种方式存储数据仓库,包括按 关系数据库、多维数据库、平面文件、层级数据库、对象数据库,等等。 通常创建根据数据仓库产生的报告以揭露出对于商号、政府实体、和/或 其它团体很重要的具体指标。通常,所述报告耗用限定数量的处理和存 储资源,这可能导致在存储数据的规模增加时数据仓库性能下降。而且,如果多个客户在重叠的时间里从特定数据仓库寻找报告,下 降的表现能力可能导致令人不满的客户端等待时间,和/或不能以响应于 客户端迅速转换需求的方式运行查询。例如, 一些数据仓库可能需要多 个小时的处理时间以生成给客户的报告。如果客户接下来为报告选择另 一组参数,那么客户必须等待大量时间以在下一时机在超负荷的数据仓 库上运行査询。在其它时间,依据数据仓库的处理量,处理时间可能降 低,从而使得数据仓库管理器很难对多个客户端有效地分配和/或管理数 据仓库处理时间。附图说明图1是例示了数据仓库系统示例的结构图。 图2是图1的示例数据仓库优化器的框图。图3是可执行以实现图1和2的示例数据仓库优化器的机器可读指令典型示例的流程图。图4是可执行以为图3的示例指令获取数据的机器可读指令典型示、^ 5是可执行以在图3的示例指令中处理数据的机器可读指令典型示例的流程图。图6是提高数据仓库性能的示例数据格式器的框图。图7是用在图1的示例系统中的示例数据仓库架构和对应的层级目录路径。图8是可执行以组织图7的示例层级目录路径的机器可读指令典型 示例的流程图。图9是另一示例数据仓库优化器的框图。图10是用来执行图3 — 5和/或图8的示例机器可读指令以实现本文描述的示例系统和/或方法的示例处理器系统的结构图。 具体实施例方式数据仓库收集关于一个或更多兴趣主题的大量信息,对兴趣主题仅 举几例,例如为消费者和/或企业的消费习惯,交易数据(例如,金融市 场交易,房地产交易等),人口增长信息,和/或多媒体广播收看行为。维 护和控制数据仓库设施和/或提供数据存储、处理、分析、和/或报告生成 服务的企业面临由这一增长带来的挑战。 一般而言,由于耗用数据仓库 存储容量,需要额外的处理能力和/或处理周期以分析数量越来越多的收 集数据。如本文中应用的,数据分析(处理)可以包括但不限于搜索所收集 的数据参数之间的趋势,对所收集的数据执行统计功能,积累计算结果, 和/或生成反映查询结果的报告给最终用户审査。数据仓库的数据处理、 分析和/或存储功能竞争处理资源,从而随着收集数据的增长使数据仓库 系统负担加重。向客户提供这种存储和/或处理服务的数据仓库企业有时会试图通 过向计算机服务器增加处理器、向数据仓库系统增加存储空间、和/或实 施数据仓库子系统来管理客户期望。除了改变和/或更新数据仓库基础结 构以改善性能之外,这些数据仓库企业也可以向他们的客户提供关于完 成报告的周转时间的预先通知,以确保客户不会失望。如果客户事先知 道多长时间才能拿到指定的报告,则客户期望可以与事实完全相符,从 而提高客户满意度。然而,无论是否预先通知客户,过长的报告生成处 理时间仍可能导致客户的不满。此外,报告生成处理时间可能会取决于 一天中不同时间的利用率,这样的利用率会引起预计处理时间意外波动, 从而难以准确地向客户提供预先通知。为了适应不同的客户,数据仓库企业可以使用许多专用数据栈(data mart)。如本文中应用的,"专用数据栈"是一个或更多个集中于一个或 更多个特定业务和/或主题的较小的数据库。然而,尽管存在专用数据桟的规模小于聚集的数据仓库的规模的事实,但是专用数据栈可能增长到 很大的规模,从而对报告生成和其他数据库性能特点产生负面影响。本文中描述的示例方法和装置可以用来提高数据仓库性能。总的来 说,本文中示出的示例方法和装置可以由数据仓库就地使用,和/或作为 应用编程接口 (API)提供给一个或更多客户端,以在一个或更多个人计 算机、服务器、和/或其他计算平台上运行。API可以包括图形用户界面 (GUI),和/或数据仓库可以响应于简单的基于网络的报告请求向他们的 客户提供全面解决方案。图1是根据本公开的教导构造的示例数据仓库系统100的结构图。 示例系统100包括馈送到数据仓库优化器104的输入的数据分析指令 102。数据分析指令102可以构造为,例如,包含有关客户端目标的详细 内容的可扩展标记语言(XML)文件。数据分析指令102可以以任何计 算机语言编写和/或可以釆取任何替换形式,如文本文件,字符分隔的文 件(character delimited file),和/或可以解析为具体的数据参数、统计方 法,和/或报告格式参数的二进制文件,而没有任何限制。例如,国家广 播公司客户可以要求一份包含广播节目、新闻事件和/或商业收视率的收 视率数据的报告。此外,该广播公司客户可能需要以统计的方式分离的 子报告以确定,例如,哪个年龄组别的观众观看一个或多个特定的广播 节目。并且,该广播客户可能需要这种以统计的方式分离的子报告按诸 如国家、地区、州、郡、和/或城市的地理界限分离收视率信息。本领域 普通技术人员将能够理解,由数据仓库存储和/或处理的数据不限于收视 率信息,也可能包括任何类型的信息。例如,数据仓库信息可以包括但 不限于金融交易信息、人口统计信息、订阅服务消费信息、医疗信息、 处方药的使用和/或供应信息、销售信息(例如,销售点信息)、天气信息 和/或行为信息。如下文进一步详细讨论的,所示出的示例的数据仓库优化器104与 一个或更多数据仓库106、 108、 110通信。各数据仓库106、 108、 110 可以包括一个或更多数据库112以存储一种或更多种类型的数据。在所 例示的示例中, 一个数据仓库106以通讯的方式直接连接到数据仓库优化器104。到数据仓库的直接连接可以通过一个或更多连接和/或通讯协 议完成,该通讯协议包括但不限于通用串行总线(USB)通信协议和/或 &6^^^@通信协议(即IEEE-1394)。此外,所示出的示例的数据仓库优 化器104和数据仓库106、 108、 110通过诸如内联本文档来自技高网...

【技术保护点】
一种对从数据仓库所接收的数据进行格式化的方法,该方法包括以下步骤: 接收分析指令; 基于所述分析指令从所述数据仓库检索数据;以及 将映射文件与事实表相关联,该映射文件存储在第一层级目录文件路径中。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:史提夫拉夫达斯道格麦克道尔
申请(专利权)人:尼尔森美国有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1