【技术实现步骤摘要】
本公开涉及数据处理。
技术介绍
一般情况下,当数据从源数据库传送到目标数据库时,所传送的数据在传送之前被串行化。源数据库和目标数据库可以位于计算机网络的不同节点、一个位置中的不同存储组件、或它们的组合。在串行化(serialization)处理期间,源系统可以顺次读出存储在源数据库中的数据。然后源系统可以将串行化的数据写入传送介质以便将数据传送到目标系统。目标系统可以从传送介质读出传送的数据并且可以将传送的数据解串行化。在解串行化(deserialization)的处理中,目标系统可以创建目标数据库,并且将传送的数据顺次地写入目标数据库。一般情况下,在解串行化处理期间使用的写入顺序对应于在串行化处理期间使用的读出顺序。
技术实现思路
本公开涉及用于数据传送操作中的串行化处理的计算机实现的方法、计算机可读介质和计算机系统。一种用于提高从第一数据库到第二数据库的数据传送效率的计算机实现的方法包括:分析存储在第一数据库中的数据列以确定至少一个串行化参数,所述至少一个串行化参数包括重复(repetition)计数器、复制(replication)计数器或变量类型;基于重复计数器或复制计数器中的至少一个确定与数据相关联的数据串行化方案,其中数据串行化方案包括重复方案或者复制方案中的至少一个;基于变量类型确定与数据相关联的变量串行化方案;对于存储在第一数据库中的每列数据,重复所述分析、所述确定数据串行化方案、和所述确定变 ...
【技术保护点】
一种用于改进从第一数据库到第二数据库的数据传送效率的计算机实现的方法,该方法包括:分析存储在第一数据库中的数据列以确定至少一个串行化参数,所述至少一个串行化参数包括重复计数器、复制计数器或变量类型;基于重复计数器或复制计数器中的至少一个确定与数据相关联的数据串行化方案,其中数据串行化方案包括重复方案或者复制方案中的至少一个;基于变量类型确定与数据相关联的变量串行化方案;对于存储在第一数据库中的每列数据,重复所述分析、所述确定数据串行化方案、和所述确定变量串行化方案;使用与数据相关联的数据串行化方案和与数据相关联的变量串行化方案,串行化存储在第一数据库中的数据;以及将串行化数据传送到第二数据库。
【技术特征摘要】
2014.12.12 US 14/568,8641.一种用于改进从第一数据库到第二数据库的数据传送效率的计算机实现的方法,该
方法包括:
分析存储在第一数据库中的数据列以确定至少一个串行化参数,所述至少一个串行化
参数包括重复计数器、复制计数器或变量类型;
基于重复计数器或复制计数器中的至少一个确定与数据相关联的数据串行化方案,其
中数据串行化方案包括重复方案或者复制方案中的至少一个;
基于变量类型确定与数据相关联的变量串行化方案;
对于存储在第一数据库中的每列数据,重复所述分析、所述确定数据串行化方案、和所
述确定变量串行化方案;
使用与数据相关联的数据串行化方案和与数据相关联的变量串行化方案,串行化存储
在第一数据库中的数据;以及
将串行化数据传送到第二数据库。
2.如权利要求1所述的方法,还包括:
在所述分析之前,确定第一数据库是否是基于行的数据库;以及
如果第一数据库是基于行的数据库,则将第一数据库传送为基于列的数据库。
3.如权利要求1所述的方法,其中,传送还包括:
压缩串行化数据;以及
传送压缩的串行化数据。
4.如权利要求1所述的方法,其中,确定数据串行化方案还包括:
如果重复计数器小于预定限制,则确定数据串行化方案包括重复方案;以及
如果重复计数器大于或等于所述预定限制而且复制计数器大于预定阈值时,则确定数
据串行化方案包括复制方案。
5.如权利要求1所述的方法,其中,确定变量串行化方案还包括:
如果变量类型是整数,则确定变量串行化包括整数方案;以及
如果变量类型是字符,则确定变量串行化包括字符方案。
6.如权利要求1所述的方法,其中,所述重复方案包括:
将重复计数器写入传送介质;
将值集合中的至少一个值串行化到传送介质;
确定与数据值相对应的索引;以及
将索引写入传送介质。
7.如权利要求1所述的方法,其中,复制方案包括:
将附加值计数器设置为零;
将数据值写入传送介质;
读出下一个数据值;
响应于下一个数据值等于该数据值的确定,将附加值计数器增加一;以及
将附加值计数器写入传送介质。
8.一种用于改进从第一数据库到第二数据库的数据传送效率的系统,该系统包括:
存储器;以及
至少一个硬件处理器,其与存储器互操作地耦合并且被配置为:
分析存储在第一数据库中的数据列以确定至少一个串行化参数,所述至少一个串行化
参数包括重复计数器、复制计数器或变量类型;
基于重复计数器或复制计数器中的至少一个确定与数据相关联的数据串行化方案,其
中数据串行化方案包括重复方案或者复制方案中的至少一个;
基于变量类型确定与数据相关联的变量串行化方案;
对于存储在第一数据库中的每列数据,重复所述分析、所述确定数据串行化方案、和所
述确定变量串行化方案;
使用与数据相关联的数据串行化方案和与数据相关联的变量串行化方案,串行化存储
在第一数据库中的数据;以及
将串行化数据传送到第二数据库。
9.如权利要求8所述的系统,其中,所述至少一个硬件处理器还被配置为:
在所述分析之前,确定第一数据库是否是基于行的数据库;以及
如果第一数据库是基于行的数...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。