优化联合数据库管理系统的方法和系统技术方案

技术编号:2836904 阅读:254 留言:0更新日期:2012-04-11 18:40
用于配置和使用联合数据库管理系统的方法、系统和程序产品。元数据和查询的设计包括首先确定数据源服务器的模式和元数据配置的步骤。下一个步骤是列举可用资源,并列举安全性和机密性需求。这些用于根据该模式和元数据、列举的可用资源以及列举的安全性和机密性需求计算最优的联合数据库管理系统设计;并设计最优的联合数据库管理系统。

【技术实现步骤摘要】

文中所述的本专利技术涉及从联合(federated)数据库系统即从透明地将多个自主(autonomous)数据库系统集成为单个虚拟数据库即联合数据库的元数据库管理系统提取数据。构成数据库仍是自主的、分离的和不同的。文中所述的方法、系统和程序产品涉及搜索联合分布式计算机系统内存储的数据以及分布式数据库的管理,包括数据库数据和文件的访问和检索,以及从联合数据库检索数据库数据和文件。本专利技术的另一个方面包括组织数据或文件并使其相互关联,包括关系模型、网络模型、层次模型和实体-关系模型。
技术介绍
联合数据库系统是一种元数据库管理系统(DBMS),其透明地将分离的、不同的多个自主数据库系统集成为单个联合数据库。构成数据库经由计算机网络、互联网、局域网和虚拟网络互连,并且可在地理上分散。由于构成数据库系统仍保持自主,所以联合数据库系统是对将多个异类数据库合并在一起的不简单的任务的一种替代选择。通过数据抽象、包装器(wrapper)函数和容器函数,联合数据库系统可提供统一的前端用户界面,使得用户可通过单个查询在多个数据库内存储和检索数据,即使构成数据库是异类的。为此,联合数据库系统必须能够将查询解构成子查询以便提交给相关的构成DBMS,此后系统必须合并或聚合子查询的结果集。由于各数据库管理系统使用不同的查询语言,所以联合数据库系统必须频繁地将包装器应用于子查询以将它们转换成合适的查询语言。迄今为止,联合数据库已被以多种方式预测能够在概念层次解决无数问题。但是,对于真实世界的实际问题,联合系统还没有实现上述预测。一个尤其苦恼的挑战是获得针对多维物理和“人员”挑战的最优解决方案。因此,很清楚,需要考虑超出数据库元数据层次和机器层次的问题,并探索解决方案空间(solution space)和相关联的软约束。软约束是指法律和制度上的约束例如机密性和道德规范、人员可用性、性能需求等。
技术实现思路
这些以及其他问题可用文中所述的方法、系统和程序产品消除。具体地,文中所述的本专利技术提出了一种用于使技能和资产尤其是人员技能和人力资产(people asset)与需求和需要匹配的方法、系统和程序产品。具体地,本专利技术的方法、系统和程序解决了这样叙述的分配问题“我有一组人员,每个人都具有一组技能,而由于外部约束(法律的、集体谈判等),仅能向某些人分配某些任务,某些数据不能离开某些地点或者不能给某些人,并且某些数据不能具体化”。根据文中所述的本专利技术,数据,包括传统数据库数据和来自异类数据库的数据,被联合以生成解决方案空间,其中例如通过整数规划优化解决方案集。该方法、系统和程序产品利用数据库联合和“提取、转换和加载”(“ETL”)数据库管理来查询、搜索和选择性地提取数据,呈现数据,使用复杂优化例如整数规划、混合整数规划、试探法和人工智能等技术、人为干预和请求另外的数据来分析和呈现数据。当该方法、系统和程序产品用于研究或临床环境,并且例如随后公布(或提交给管理当局)时,需要释放足够的数据以满足学术上的、制度上的或管理上的需求。这使得产物为大量个别数据的总和。查询、搜索和选择性提取数据的步骤是遵守具体化(materialization)和呈现上的约束执行的。作为示例而不是限制,这些约束包括私密的个人数据例如性传播疾病的存在或不存在、遗传异常的存在或不存在乃至信誉度。类似地,所述约束可包括制度上机密的数据例如何人将执行工作、资源分配和交付、预算、技能集、策略、费用分配、代替现金支付的实物捐献、输入和输出的时间约束。另外,在临床、测试或流行病学上下文中,信息传递可被法律例如HIPP限制和私人约束所约束。通过联合数据,整个数据的全体仅需在计算期间具体化,而完成的产物仅是聚合数据如总和以及统计量。在实际计算中,使用在联合系统内的不同数据库管理系统的不同表上的临时表、关联表构建中间数据库。一当在联合数据库上运行查询并报告,所述临时表就被锁定或消失。文中所述的方法、系统和程序产品探索了整个问题空间,展示了所有约束,并使用例如整数规划技术针对加权的、多维准则函数(multidimensional criteria function)优化这些约束。整个数据集用于对可能的解决方案建模,包含数据结构、元数据、数据模式和可能的关联表(associative table),从而比较如被成本、策略、人员和资产的可用性以及必需的时间线约束的ETL解决方案与联合解决方案。附图说明在附图中示出了本专利技术的各个方面。图1示出最初的发现当前环境的步骤。图2示出接下来的分析当前环境的步骤。图3示出定义可用资源的步骤。图4示出定义项目(project)约束的步骤。图5示出设计实现需求的最优解决方案。图6示出给定所有约束、要求(claim)和资源,计算最优解决方案的步骤。图7示出联合数据系统的概观。图8示出用于设计联合数据库系统的流程图的概观。图9示出执行查询并随后处理结果集的流程图的概观。图10示出从输入约束变量和约束通过对约束和变量的分析到优化优化工具和技术并执行优化的判定树。图11示出数据库联合和“提取、转换和加载”(ETL)数据库管理的高层概观,该数据库管理用于查询、搜索和选择性地提取数据,呈现数据,使用复杂优化例如整数规划、混合整数规划、试探法和人工智能等技术、人为干预和请求另外的数据来分析和呈现数据。具体实施例方式本专利技术的方法、系统和程序产品解决了这样叙述的分配问题“我有一组人员,每个人都具有一组技能,而由于外部约束(法律约束、集体谈判等),仅能向某些人分配某些任务,某些数据不能离开某些地点或者不能给某些人,并且某些数据不能具体化”。当本专利技术的方法、系统和程序产品用于研究环境并随后公布(或者提交给管理当局)时,需要释放足够的数据以满足学术上的、制度上的或管理上的需求。数据库联合使得输出为大量个别数据的结果。通过联合数据,数据的全体仅在计算期间具体化,而完成的产物仅是聚合数据如仅是总和以及统计量。在实际计算中,使用从在联合系统内的不同数据库管理系统的不同表得到的临时表、关联表来构建中间数据库。一当在联合数据库上运行查询并报告,该临时表就被锁定或消失。文中所述的方法、系统和程序产品研究了整个问题空间,展示了所有约束,并针对加权的多维准则函数优化这些约束。整个数据集用于对可能的解决方案建模,包括数据结构、元数据、数据模式和可能的关联表,从而比较如被成本、策略、人员和资产的可用性以及必需的时间线约束的ETL解决方案与联合解决方案。图1示出最初的发现包含单元1001、1003、1005、1007的当前环境的步骤。这包括评估不同的源系统数据约束以及回顾性和预期性数据集成挑战,客户和行业数据标准的影响。约束和机会包括当前的集成能力,所需的集成解决方案的性质以及客户团队技能。图2示出下一个分析包含单元1001、1003、1005、1007的当前环境的步骤。分析当前环境包括理解按照源的可用元数据1011、1013、1015、1017。还包括分析当前环境以分析数据集成方法和按照源的数据模型1021、1023、1025、1027,指示ETL或联合或混合方法,并定义必须遵守的集成规则1031、1033、1035、1037。随后,访问当前的技能1041、1043、1045、1047,推荐最优本文档来自技高网
...

【技术保护点】
一种用于优化具有联合数据库服务器和多个数据源服务器的联合数据库管理系统的方法,该方法包括以下步骤:a)确定数据源服务器的模式和元数据配置;b)列举可用资源;c)列举安全性和机密性需求;d)根据该模式和元数据、列举的可用资源以及列举的安全性和机密性需求计算最优的联合数据库管理系统;并e)设计最优的联合数据库管理系统;以及f)提供用于包括用户试探和数据输入的用户输入的功能。

【技术特征摘要】
US 2006-5-2 11/416,9731.一种用于优化具有联合数据库服务器和多个数据源服务器的联合数据库管理系统的方法,该方法包括以下步骤a)确定数据源服务器的模式和元数据配置;b)列举可用资源;c)列举安全性和机密性需求;d)根据该模式和元数据、列举的可用资源以及列举的安全性和机密性需求计算最优的联合数据库管理系统;并e)设计最优的联合数据库管理系统;以及f)提供用于包括用户试探和数据输入的用户输入的功能。2.根据权利要求1的方法,其中,可用资源包括人员、技能集、网络能力、计算设备、预算、时间约束、软件系统、数据库管理系统应用程序接口和存储器。3.根据权利要求1的方法,其中,所述安全性和机密性需求包括病历机密性。4.根据权利要求1的方法,还包括使用实体统一化方案、共形维度、聚合方案,统一的元数据以及统一的数据模型中的一个或多个设计最优的联合数据库管理系统。5.一种向联合数据库管理系统提交查询并从...

【专利技术属性】
技术研发人员:RR弗里德兰德JR克雷默R亨尼塞
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1