当前位置: 首页 > 专利查询>SAP股份公司专利>正文

删除多级存储架构中的记录制造技术

技术编号:9295851 阅读:133 留言:0更新日期:2013-10-31 00:25
公开了从第二级存储或主存储中删除数据记录。执行对第一级存储中的数据记录的查找,其中该数据记录由行标识符定义。如果在第一级存储中发现该行标识符,则执行在第二级存储和主存储中对代表该数据记录的更新的更新的行标识符的查找,数据记录的更新由更新的行标识符定义。如果在第二级存储中发现该更新的行标识符,则从第一级存储生成撤销日志,以使所述更新的行标识符无效。生成代表无效的更新的行标识符的标记,而且生成重做日志以便在第一级存储中重新存储该数据记录。

【技术实现步骤摘要】
删除多级存储架构中的记录相关申请的交叉引用本申请要求于2012年4月30日提交的题为“FIXEDSTRINGDICTIONARY(固定字符串字典)”的第61/640,689号美国临时申请和于2012年5月11日提交的题为“UNIFIEDTABLEUSINGMULTI-LEVELSTORAGEARCHITECTURE(使用多级存储架构的统一表)”的第61/646,162号美国临时申请的优先权,其全部公开通过引用并入本文。
这里描述的主题涉及使用具有多级存储的统一表架构(unifiedtablearchitecture)的内存数据库(in-memorydatabase)的数据管理,而且更具体地,涉及从统一表架构的更高级存储结构删除记录的系统和方法。
技术介绍
现代化业务应用中的数据管理是如今软件产业中最具挑战性的课题之一。不仅是因为数据驱动如今的业务,还因为提供了发展新颖的业务理念或业务案例的基础。所有不同情况中的数据管理已成为每个组织的核心资产。此外,数据管理已经得到高级管理层的相当重视,作为推动和发展当前业务的核心工具。在系统侧,数据管理场景已经变得极其复杂且难以管理。高效、灵活、健壮和具有成本效益的数据管理层是如今的业务环境中必不可少的多个不同应用场景的核心。最初,典型的企业资源规划(ERP)系统被实施为操纵(handle)这样的应用场景的信息处理中枢(backbone)。从数据库系统的角度来看,ERP系统的联机事务处理(onlinetransactionalprocessing,OLTP)的工作负荷通常需要操纵成千上万的并发用户以及具有高更新负荷和非常有选择性的点查询的事务。另一方面,数据仓库系统(通常被认为是OLTP的对应物)要么在巨大的数据量上运行聚集查询,要么对存储在数据库中的伪影(artifact)计算供分析的统计模型。不幸的是,像用于识别数据流中异常现象的实时分析或者ETL/信息集成任务的应用增加了种类繁多的不同的、而且在某些情况下对于现代业务应用环境中的数据管理层而言是绝对具有挑战性的要求。有些人已经推测,传统的数据库管理系统不再能够提供针对各种不同要求的完整答案。针对特定问题将涌现专门的系统。大型数据管理解决方案现在通常被看作是用于不同应用场景的、具有不同能力的不同系统的集合(zoo)。例如,典型的行存储仍然主导着的OLTP领域。对于基于实体的交互模型而言,在记录中保持逻辑实体和物理表示之间的1:1的关系似乎是显而易见的。基于列组织的数据结构在解析领域中获得越来越多的关注,从而避免所查询的列的投影并且实现显著更好的数据压缩率。键值存储被大举引入商业数据管理解决方案,以便不仅应对“大数据”容量而且提供用于将并行执行的过程代码的平台。此外,分布式文件系统提供了廉价的存储机制和类似云的弹性的灵活的并行度,从而分布式文件系统使得键值存储成为数据管理领域中的一等公民。三重存储使已经过多的系统更加完整,三重存储用于应对方案灵活的数据和基于图形的组织。由于方案伴随着数据,因此系统提供了高效的方式来显式地利用实体之间建模的关系、运行分析图形算法、并展示一般用于弱类型实体的存储库。虽然专门的系统可以在首先注重性能的角度被认为是聪明的举动,但是过多的系统在链接不同的系统、运行数据复制和传播作业、或在多个系统之间协调查询场景方面产生巨大的复杂性。此外,设置和维护这样的环境不仅是复杂且容易出错的,而且还伴有显着更高的总拥有成本(totalcostofownership,TCO)。从高级角度来看,对目前情况下的动机可以做出以下观察:使用前景:SQL不再被认为是唯一适合现代业务应用的交互模型。用户要么被应用层完全屏蔽,要么想要直接与他们的数据库进行交互。在第一种情况下,需要利用紧密耦合机制来最佳地支持应用层。在第二种情况下,需要利用用于特定应用域的内置数据库特征的脚本语言。此外,从编程的角度来看,还需要全面支持域特定的和专有的查询语言,而且还对使用户能够直接解决并行性的机制存在巨大需求。成本意识:存在明确的要求:要求通过为不同类型的工作负荷和使用方案提供综合的解决方案,来为完整的数据管理栈提供较低的TCO解决方案,范围从硬件成本到设置成本到运营和维护成本。性能:性能被连续不断地确定为使用专门的系统的主要原因。挑战在于提供能够在任何可能或需要的时候使用专门的运算符或数据结构的灵活的解决方案。不同的工作负荷特性不是使用专门的系统的集合的全部理由。我们以往操纵业务应用的经验使我们支持需要专门的运算符集合这样的假说。存在对具有各自生命周期和管理设置的单独系统的偏见。然而,提供单一的封闭系统太受限制,而且替代地,具有公共服务基本元素(primitive)的灵活的数据管理平台更受欢迎。不同的工作负荷特性(范围从通过支持主要读取的分析的DWH工作负荷的大量事务处理,到流处理领域的高更新场景)不是选择专门的系统的集合的全部理由。操纵业务应用的经验导致对专门的运算符集合的需要。除了纯数据处理性能之外,应用层和数据管理层之间缺乏适当耦合机制已经被确定为最先进(state-of-the-art)系统的主要缺陷之一。此外,具有各自生命周期和管理设置的单独系统更难以设置和管理,而单一的封闭系统通常又太受限制。需要的是灵活的数据管理平台,其一方面具有公共服务基本元素,另一方面具有单独的查询执行运行时环境。
技术实现思路
本文档描述了内存数据库平台,而且描述了用于应对不同事务性工作负荷的数据管理的一些具体方面的细节。在一方面,系统和方法包括提供内存计算系统的统一表架构。统一表架构包括多级存储架构,该存储架构具有第一级存储结构,用于将传入的数据请求以逻辑行的格式存储为数据记录,第二级存储结构,用于以逻辑列的格式对数据记录进行编码和存储,以及主存储,用于压缩并存储已编码的数据记录以进行长期存储。系统执行从第二级存储或主存储删除数据记录的方法。该方法包括在第一级存储中执行对数据记录的查找,其中该数据记录由行标识符定义。如果在第一级存储中发现该行标识符,则该方法包括执行在第二级存储和主存储中对代表该数据记录的更新的更新的行标识符的查找,其中该数据记录的更新由更新的行标识符定义。如果在第二级存储中发现该更新的行标识符,该方法包括从第一级存储生成撤销日志,以使该更新的行标识符无效,以及生成代表无效的更新的行标识符的标记。该方法还包括如果在第二级存储中没有发现该更新的行标识符,则在第一级存储中重新存储该数据记录。当前主题的实现方式可以包括,但不限于,包括所描述的一个或多个特征的系统和方法以及物品,所述物品包括有形地具体实施的机器可读介质,可操作以使得一个或多个机器(例如,计算机等)产生这里所描述的操作。类似地,还描述了计算机系统,其可以包括一个或多个处理器以及耦合到所述一个或多个处理器的一个或多个存储器。存储器可以包括计算机可读的存储介质,而且可以包括、编码、存储等等一个或多个程序,所述一个或多个程序使得一个或多个处理器执行这里所描述的一个或多个操作。与当前的主题的一个或多个实施方式相一致的计算机实施的方法可以由驻留在单一计算系统或多个计算系统中的一个或多个数据处理器实施。这样的多个计算系统可以连接,而且可以通过一个或多个连接交换数据和/或命令本文档来自技高网
...
删除多级存储架构中的记录

【技术保护点】
一种在具有多级存储架构的内存计算系统的统一表架构中从第二级存储或主存储删除数据记录的方法,该多级存储架构具有用于将传入的数据请求以逻辑行的格式存储为数据记录的第一级存储结构、用于以逻辑列的格式对数据记录进行编码和存储的第二级存储结构、以及用于压缩并存储已编码的数据记录以进行长期存储的主存储,该方法包括:由一个或多个处理器执行在第一级存储中的表中对所述数据记录的查找,该数据记录由该表的行标识符定义;如果在第一级存储中发现该行标识符,则由一个或多个处理器执行在第二级存储和主存储中对代表该数据记录的更新的更新的行标识符的查找;如果在第二级存储中发现该更新的行标识符,则由一个或多个处理器从第一级存储生成撤销日志,以使所述更新的行标识符无效;以及如果在第二级存储中没有发现该更新的行标识符,则由一个或多个处理器生成重做日志,以便在第一级存储中重新存储该数据记录。

【技术特征摘要】
2012.04.30 US 61/640,689;2012.05.11 US 61/646,1621.一种在具有多级存储架构的内存计算系统的统一表架构中从第二级存储或主存储删除数据记录的方法,该多级存储架构具有用于将传入的数据请求以逻辑行的格式存储为数据记录的第一级存储结构、用于以逻辑列的格式对数据记录进行编码和存储的第二级存储结构、以及用于压缩并存储已编码的数据记录以进行长期存储的主存储,该方法包括:由一个或多个处理器执行在第一级存储中的表中对所述数据记录的查找,该数据记录由该表的行标识符定义;如果在第一级存储中发现该行标识符,则由一个或多个处理器执行在第二级存储和主存储中对代表该数据记录的更新的更新的行标识符的查找;如果在第二级存储中发现该更新的行标识符,则由一个或多个处理器从第一级存储生成撤销日志,以使第一级存储中的表中定义数据记录的行标识符无效;以及如果在第二级存储中没有发现该更新的行标识符,则由一个或多个处理器生成重做日志,以便在第一级存储中重新存储该数据记录。2.如权利要求1所述的方法,其中,从第一级存储生成撤销日志还包括生成代表无效的更新的行标识符的标记。3.如权利要求1所述的方法,还包括,如果该更新的行标识符尚未在多级存储架构的保存点中持久化,则在重新启动期间在第一级存储中恢复该数据记录。4.如权利要求1所述的方法,还包括在重新启动期间生成第二无效的更新的行标识符。5.一种计算机实施的内存数据库的数据管理方法,包括:提供内存计算系统的统一表架构,该统一表架构具有多级存储架构,该多级存储架构具有用于将传入的数据请求以逻辑行的格式存储为数据记录的第一级存储结构、用于以逻辑列的格式对数据记录进行编码和存储的第二级存储结构、以及用于压缩并存储已编码的数据记录以进行长期存储的主存储;由一个或多个处理器执行在第一级存储中对所述数据记录的查找,该数据记录由行标识符定义;如果在第一级存储中发现该行标识符,则由一个或多个处理器执...

【专利技术属性】
技术研发人员:F菲尔波李柱昌I施雷特
申请(专利权)人:SAP股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1