大文件排序方法及系统技术方案

技术编号：8907174 阅读：200 留言：0更新日期：2013-07-11 04:51

本发明专利技术公开了一种大文件排序方法，包括如下步骤：(a)压缩：将所述大文件包括的每一条原始数据记录均进行压缩处理生成对应的新数据记录，并将所有新数据记录组成一个新文件；(b)排序：将所述新文件所包括的新数据记录使用DFSORT工具进行排序；(c)解压：将排序后的每一条新数据记录进行解压处理，还原为所述原始数据记录。本发明专利技术还公开了一种大文件排序系统，用于对包括海量数据记录的大文件进行排序处理。本发明专利技术的有益效果在于：通过压缩，缩小了参与排序的数据记录以及由这些数据记录组成的文件的大小，降低了CPU及内存开销，提高了排序速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种大文件排序方法及系统，主要用于解决IBM大型机环境、z/OS操作系统下海量的顺序文件(QSAM文件)排序的性能问题。
技术介绍
在使用IBM大型机(z/OS操作系统)环境下进行批量处理的过程中，为了提高处理效率，往往会采用DFSORT工具对海量的顺序文件进行排序处理。DFSORT工具是IBM研发的排序工具软件，在业界被广泛地使用，它可以有效地提高批量处理速度。但在处理海量数据时，IBM的DFSORT工具仍显不足，排序处理的时间过长，不能够满足应用要求。例如，某银行的一个中等规模的分行客户资料包括13227038条客户数据记录，每条数据记录多达2576字节，采用DFSORT工具对该文件进行排序的时间高达29.48分钟。排序步骤所用的时间较长，影响了批处理的效率，成为制约批处理速度的关键环节。
技术实现思路
针对现有技术的上述问题，本专利技术要解决的技术问题是提供一种利用DFSORT工具对包含有海量的数据记录的大文件的进行快速排序的方法和系统。为了解决上述技术问题，本专利技术提供了大文件排序方法，所述大文件包括海量数据记录，包括如下步骤:(a)压缩:将所述大文件包括的每一条原始数据记录均进行压缩处理生成对应的新数据记录，并将所有新数据记录组成一个新文件；(b)排序:将所述新文件所包括的新数据记录使用DFSORT工具进行排序；(C)解压:将排序后的每一条新数据记录进行解压处理，还原为所述原始数据记录。作为优选，其中，所述压缩步骤进一步包括:(al)拆分:将每一条所述原始数据记录的字符从高位到低位以固定的字节数为单位按顺序拆分成多个字符段；(a2)...

【技术保护点】
大文件排序方法，所述大文件包括海量数据记录，其特征在于，包括如下步骤：(a)压缩：将所述大文件包括的每一条原始数据记录均进行压缩处理生成对应的新数据记录，并将所有新数据记录组成一个新文件；(b)排序：将所述新文件所包括的新数据记录使用DFSORT工具进行排序；(c)解压：将排序后的每一条新数据记录进行解压处理，还原为所述原始数据记录。

【技术特征摘要】

【专利技术属性】
技术研发人员：廖文胜，徐慧斌，
申请(专利权)人：中国银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人