基于SAP数据仓库的凭证数据检索方法技术

技术编号:10309112 阅读:363 留言:0更新日期:2014-08-13 13:01
本发明专利技术公开了一种基于SAP数据仓库(BW)的凭证数据检索方法,包括:从变动凭证数据中滤除在待出报表账期范围外并且已同步的凭证数据,并从剩余的凭证数据中提取感兴趣的凭证数据;以及滤除所述感兴趣的凭证数据中已加载到PSA中的凭证数据;对比所述PSA中记录的凭证抽取时间与凭证数据变动时间,标识上一步骤中凭证数据变动时间晚于凭证抽取时间的凭证数据;以及针对与变动凭证数据相关的BW数据模型,判断BW数据模型中的数据加载请求包是否已加载完成,当加载未完成时,判断存在在途凭证数据。通过上述技术方案,能够实现对大量待抽取凭证中有价值凭证信息的快速检索,进而大大缩短通过BW系统出具报表的时间。

【技术实现步骤摘要】
基于SAP数据仓库的凭证数据检索方法
本专利技术涉及数据处理领域,具体地,涉及一种基于SAP数据仓库的凭证数据检索方法。
技术介绍
SAPBW是SAPBusinessinformationWarehouse的缩写,中文意思是“SAP数据仓库”。数据仓库的概念是W.H.Inmon1991年提出来,被人们尊称为“数据仓库之父”,在其著作《BuildingtheDataWarehouse》一书中给出了数据仓库的一个简短而全面的定义:数据仓库是一个面向主题(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。根据数据仓库的相对稳定的特点,数据仓库中的数据主要是提供决策分析之用,涉及的操作主要是查询,因此数据一旦进入BW系统后,数据状态需要相对稳定,需要尽量少的修改和删除。随着信息化技术的发展,对BW系统如何能及时的反应OLTP(在线业务系统)的最新变化的要求日益增加。目前SAPECC系统与SAPBW系统之间的数据同步是基于SAP数据源,通过定时数据抽取的机制实现系统之间数据同步,由于到SAP数据源数据抽取效率及对ECC系统性能的影响,以及SAPBW中基于数据请求包的加载机制的限制,数据抽取的频率通常设定为每天抽取一次,最小间隔要在1小时以上。导致当在SAPECC中新增或调整一笔凭证信息,无法快速的在SAPBW系统的报表中体现出来,无法满足用户对SAPBW系统中数据时效性的要求。SAP通过使用HANA的硬件及SLT产品实现ECC与BW系统之间的数据的实时同步,但需要花费很高的成本。SAPBW系统标准的增量抽取中会包含一大部分报表出具时不需要的凭证信息,重复进行增量抽取时还会包含大量重复抽取的凭证信息。目前需要一种有效的方法,从每日海量的新增凭证中筛选出有价值的变动凭证信息,以实现通过用户干预的方式,基于凭证快速抽取并同步数据,满足报表出具对与SAPBW中数据时效性的要求。针对上述技术问题,现有技术中尚无良好解决方案。
技术实现思路
本专利技术的目的是提供一种方法,通过该方法实现对大量待抽取凭证中有价值凭证信息的快速检索,进而大大缩短通过BW系统出具报表的时间。为了实现上述目的,本专利技术提供一种基于SAP数据仓库(BW)的凭证数据检索方法,包括:从变动凭证数据中滤除在待出报表账期范围外并且已同步的凭证数据,并从剩余的凭证数据中提取感兴趣的凭证数据;以及滤除所述感兴趣的凭证数据中已加载到持久数据缓存区(PSA)中的凭证数据;对比所述PSA中记录的凭证抽取时间与凭证数据变动时间,标识上一步骤中凭证数据变动时间晚于凭证抽取时间的凭证数据;以及针对与变动凭证数据相关的BW数据模型,判断BW数据模型中的数据加载请求包是否已加载完成,当加载未完成时,判断存在在途凭证数据。进一步地,所述从变动凭证数据中滤除在待出报表账期范围外并且已同步的凭证数据,并从剩余的凭证数据中提取感兴趣的凭证数据的步骤包括:根据待出报表账期范围和凭证数据的账期信息,滤除所述账期范围外的变动凭证数据;以及在所述账期范围内的变动凭证数据中提取凭证数据的变动时间在上一次数据同步后的变动凭证数据。进一步地,所述感兴趣的凭证数据包括感兴趣的公司和/或公司范围的凭证数据。进一步地,该方法还可以包括:将每个步骤划分为多个子任务节点;分配完成子任务节点所需的运算到所述计算机集群中的多个计算机节点进行运算处理;保存所述多个计算机节点运算处理的状态快照;以及当所述子任务节点中断时,根据所述状态快照恢复中断前的子任务节点状态,以及继续执行中断的子任务节点。进一步地,该方法还可以包括:对所述多个计算机节点进行心跳检测;以及将分配到心跳检测无响应的计算机节点的运算再分配到其他计算机节点。进一步地,该方法还可以包括:将所述多个计算机节点的运算处理结果保存到与所述计算机集群中的所有计算机节点连接的共享存储器。进一步地,该方法还可以包括:当执行当前子任务节点的所有计算机节点运算处理完成后,对完成下一个子任务节点所需的运算进行分配。进一步地,该方法还可以包括:根据贪婪算法分配所述完成子任务节点所需的运算。进一步地,该方法还可以包括:在完成最后一个任务节点的运算后,输出运算结果。进一步地,所述计算机集群由部署云计算平台的计算机节点组成。进一步地,所述云计算平台为HADOOP云计算平台。进一步地,所述计算机节点为LINUX系统服务器。通过上述技术方案,实现对大量待抽取凭证中有价值凭证信息的快速检索,进而大大缩短通过BW系统出具报表的时间。本专利技术的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本专利技术,但并不构成对本专利技术的限制。在附图中:图1是根据本专利技术实施方式的基于SAPBW的凭证数据检索方法流程图;图2是根据本专利技术示例性实施方式的基于SAPBW的凭证数据检索方法流程图;图3是根据本专利技术示例性实施方式的基于SAPBW的凭证数据检索方法流程图;图4是根据本专利技术示例性实施方式的基于SAPBW的凭证数据检索方法流程图;图5是根据本专利技术示例性实施方式的BW数据模型结构示意图。具体实施方式以下结合附图对本专利技术的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本专利技术,并不用于限制本专利技术。图1是根据本专利技术实施方式的基于SAP数据仓库(BW)的凭证数据检索方法流程图。如图1所示,根据本专利技术实施方式的基于SAPBW的凭证数据检索方法,包括:S101,从变动凭证数据中滤除在待出报表账期范围外并且已同步的凭证数据,并从剩余的凭证数据中提取感兴趣的凭证数据;以及S102,滤除所述感兴趣的凭证数据中已加载到持久数据缓存区(PSA)中的凭证数据;S103,对比所述PSA中记录的凭证抽取时间与凭证数据变动时间,标识上一步骤中凭证数据变动时间晚于凭证抽取时间的凭证数据;以及S104,针对与变动凭证数据相关的BW数据模型,判断BW数据模型中的数据加载请求包是否已加载完成,当加载未完成时,判断存在在途凭证数据,可以提示等待加载完成。作为举例的BW数据模型可以如图5所示。在实施方式中的BW数据模型可以是在SAPBW系统中一组用于存放数据的模型,根据数据加工及数据展示的需要,BW数据模型通常采用分层设计,举例如“抽取层”存储原始数据,“转换层”存储进行过加工的数据,“展示层”存储汇总级数据。由于SAPBW系统中的数据模型采用上述分层设计,因此增量数据会以数据包的形式在例如图5所示的结构中逐层加载。例如,当数据包加载至“展示层”后,可供最终查询及报表使用,当数据包未加载至“展示层”时,增量数据无法被最终查询及报表访问到,这部分数据被称为“在途数据”。因此,在实施方式中,根据数据包得加载状态可以判断是否存在在途的数据,以及可以根据判断存在在途数据的判断结果提示等待加载完成。通过上述技术方案,通过设置多重过滤条件,能够从大量待抽取凭证中找到所需的凭证,从而实现对大量待抽取凭证中有价值凭证信息的快速检索,进而大大缩短通过BW系统出具报表的时间。在实施方式中,感兴趣的凭证数据可以包括感本文档来自技高网
...
基于SAP数据仓库的凭证数据检索方法

【技术保护点】
一种基于SAP数据仓库(BW)的凭证数据检索方法,其特征在于,该方法包括:从变动凭证数据中滤除在待出报表账期范围外并且已同步的凭证数据,并从剩余的凭证数据中提取感兴趣的凭证数据;以及滤除所述感兴趣的凭证数据中已加载到持久数据缓存区(PSA)中的凭证数据;对比所述PSA中记录的凭证抽取时间与凭证数据变动时间,标识上一步骤中凭证数据变动时间晚于凭证抽取时间的凭证数据;以及针对与变动凭证数据相关的BW数据模型,判断BW数据模型中的数据加载请求包是否已加载完成,当加载未完成时,判断存在在途凭证数据。

【技术特征摘要】
1.一种基于SAP数据仓库BW的凭证数据检索方法,其特征在于,该方法包括:从变动凭证数据中滤除在待出报表账期范围外并且已同步的凭证数据,并从剩余的凭证数据中提取感兴趣的凭证数据;以及滤除所述感兴趣的凭证数据中已加载到持久数据缓存区PSA中的凭证数据;对比所述PSA中记录的凭证抽取时间与凭证数据变动时间,标识上一步骤中凭证数据变动时间晚于凭证抽取时间的凭证数据;以及针对与变动凭证数据相关的BW数据模型,判断BW数据模型中的数据加载请求包是否已加载完成,当加载未完成时,判断存在在途凭证数据。2.根据权利要求1所述的方法,其特征在于,所述从变动凭证数据中滤除在待出报表账期范围外并且已同步的凭证数据,并从剩余的凭证数据中提取感兴趣的凭证数据的步骤包括:根据待出报表账期范围和凭证数据的账期信息,滤除所述账期范围外的变动凭证数据;以及在所述账期范围内的变动凭证数据中提取凭证数据的变动时间在上一次数据同步后的变动凭证数据。3.根据权利要求1所述的方法,其特征在于,所述感兴趣的凭证数据包括感兴趣的公司和/或公司范围的凭证数据。4.根据权利要求1-3中任一项权利要求所述的方法,其特征在于,该方法还包括:将每个步骤划分为多个子任务节点;分配完成子任务节点所需的运算到计算机集群中的多个计算...

【专利技术属性】
技术研发人员:刘新宇张克慧谭映忠刘畅关丹凤王亮郭磊陈璇
申请(专利权)人:神华集团有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1