【技术实现步骤摘要】
本专利技术涉及计算机数据处理
,更具体地,涉及ー种数据加载方法以及数据加载装置。
技术介绍
随着信息技术的发展,数据量呈现爆炸式增长的趋势。海量数据处理系统ー方面要求数据到来时能够尽快入库,这就要求在加载时对数据各方面的检查和判断尽量简単。而另一方面对数据的快速检索的需求,要求所有的数据有规律地存储,并且根据常用查询和检索条件建立索引,以便能在需要的时候快速得到查询結果。如果在数据加载的同时对其进行索引和存储方面的优化,势必需要分析和计算入库数据的特征,井根据这些特征进行有序组织,这样就大大限制了数据的写入速度,使得数据高速加载和按序组织(索引更新等操作)之间存在矛盾。
技术实现思路
为解决现有技术存在的问题,本专利技术提供了ー种数据加载方法和数据加载装置,使得能够提高数据加载的效率。根据本专利技术的一方面,提供了ー种数据加载方法,包括 步骤A,将要加载数据批量加载到临时数据表中;步骤B,根据预设定的时间间隔将所述临时数据表中的数据置换到中间数据表中;步骤C,对置放到所述中间数据表中的数据创建索引;以及步骤D,将已创建索引的数据从所述中间数据表置換到目标数据表中。在可选实施例中,所述临时数据表和目标数据表中按时间范围进行分区且分区策略相同,其中,Partn分区用于存储时间标志在(Tn+ Tn]之间的数据,其中,Tlri表示上一周期的末时刻,Tn表示当前周期的末时刻,n > I, Partn分区表示当前分区;步骤A包括根据数据中所帯的时间标志将按时间顺序到达的数据写入到临时数据表中的Partn分区;步骤B包括将所述临时数据表中的Partn分区的数据 ...
【技术保护点】
一种数据加载方法,包括:步骤A,将要加载数据批量加载到临时数据表中;步骤B,根据预设定的时间间隔将所述临时数据表中的数据置换到中间数据表中;步骤C,对置放到所述中间数据表中的数据创建索引;以及步骤D,将已创建索引的数据从所述中间数据表置换到目标数据表中。
【技术特征摘要】
1.一种数据加载方法,包括 步骤A,将要加载数据批量加载到临时数据表中; 步骤B,根据预设定的时间间隔将所述临时数据表中的数据置换到中间数据表中; 步骤C,对置放到所述中间数据表中的数据创建索引;以及 步骤D,将已创建索引的数据从所述中间数据表置换到目标数据表中。2.根据权利要求1所述的数据加载方法,其特征在于 所述临时数据表和目标数据表中按时间范围进行分区且分区策略相同,其中,Partn分区用于存储时间标志在(Tn+ Tn]之间的数据,其中,Tlri表示上一周期的末时刻,Tn表示当前周期的末时刻,η > I, Partn分区表示当前分区; 步骤A包括根据数据中所带的时间标志将按时间顺序到达的数据写入到临时数据表中的Partn分区; 步骤B包括将所述临时数据表中的Partn分区的数据置换到第一中间数据表中; 步骤C包括在所述第一中间数据表上为所述第一中间数据表中的数据建立索引;以及 步骤D包括将已建立索引的所述第一中间数据表中的数据置换到所述目标数据表中的Partn分区中。3.根据权利要求1所述的数据加载方法,其特征在于 所述临时数据表和所述目标数据表按时间范围进行分区且分区策略相同,其中,Partlri分区用于存储时间标志在(Tn_2,Tn_J之间的数据,Partn分区用于存储时间标志在(Tlri, Tn]之间的数据;所述临时数据表包括Partlri分区,Partn分区,Partn+1分区,…,Partn+k分区;目标数据表中分区根据设计要求而定;其中,Tlri表示上一周期的末时刻,1;表示当前周期的末时刻,Partn分区表示当前分区,η > I, k > O ; 步骤A包括根据数据中所带的时间标志将按时间顺序到达的数据写入到临时数据表中的Partn分区,以及将延迟到来的数据写入到Partlri分区; 步骤B包括将所述临时数据表中Partn分区的数据置换到第一中间数据表中,以及,将所述临时数据表中Partlri分区的数据置换到第二中间数据表中; 步骤C包括在所述第一中间数据表上为所述第一中间数据表中的数据建立索引,步骤D包括将已建立索引的所述第一中间数据表中的数据置换到所述目标数据表中的Partn分区中;以及 在步骤B之后还包括步骤将所述第二中间数据表中的数据插入到所述目标数据表中的Partlri分区中。4.根据权利要求1所述的数据加载方法,其特征在于,所述数据加载方法在步骤A之后还包括 在接收到不在中间数据表建立索引的指示时,将临时数据表中的数据置换到目标数据表中; 在所述目标数据表中为所述数据创建索引。5.一种数据加载装置,包括 初始加载单元,用于将要加载数据批量加载到临时数据表中; 第一索引建立单元,用于根据预设定的时间间隔将所述临时数据表中的数据置换到中间数据表中,以及对置放到所述中间数据表中的数据创建索引; 目标加载单元,用于将已创建索引的数据从所述中间数据表置换到目标数据表中。6.根据权利要求5所述的数据加载装置,其特征在于...
【专利技术属性】
技术研发人员:宋怀明,杨浩,苗艳超,刘新春,邵宗有,
申请(专利权)人:曙光信息产业北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。