【技术实现步骤摘要】
一种大数据分区存储方法及装置
本申请涉及计算机领域,尤其涉及一种大数据分区存储方法及装置。
技术介绍
当前的数据库中包括数据表,数据表用于存储数据库中的大数据。数据可以是以单字节编码(ASCII码)字符进行存储,也可以是以非ASCII码字符进行存储。在进行数据存储时,一个数据表在一个存储区域有存储数据的容量上限,基于此,数据库提供数据表的分区存储方法来实现对于大容量数据的存储。数据表的分区存储方法指的是将属于同一数据表的数据分成多个存储区域进行存储的方法,例如将同一数据表的数据均匀的存储在不同的磁盘中。但是,现有的数据表的分区存储方法只能针对ASCII码字符进行分区存储,无法针对非ASCII码字符进行分区存储。综上,现有的数据表的分区存储方法只能针对ASCII码字符进行分区存储,无法针对非ASCII码字符进行分区存储。
技术实现思路
为了解决现有大数据技术中数据表的分区存储方法只能针对ASCII码字符进行分区存储,无法针对非ASCII码字符进行分区存储的问题,本申请提供了一种大数据分区存储方法,能够支持数据表的数据进行分区存储。本申请实施例提供了一种大数据分区存储方法,所述方法包括:获取待存入数据的占用存储空间,根据所述占用存储空间以及目标数据表每个分区的数据存储容量,对所述目标数据表的待存入数据进行分区,并得到每个分区的分区标识值,所述分区为分配多个设备的存储区域进行数据的存储;将所述待存入数据中各条数据的首字符与所述每个分区的分区标识值之间建立映射关系; ...
【技术保护点】
1.一种大数据分区存储方法,其特征在于,所述方法包括:/n获取待存入数据的占用存储空间,根据所述占用存储空间以及目标数据表每个分区的数据存储容量,对所述目标数据表的待存入数据进行分区,并得到每个分区的分区标识值,所述分区为分配多个存储区域进行数据的存储;/n将所述待存入数据中各条数据的首字符与所述每个分区的分区标识值之间建立映射关系;/n根据所述各条数据的首字符,利用所述映射关系,确定所述待存入数据中各条数据所对应的分区标识值;/n根据所述映射关系,将所述每个分区的分区标识值添加到所述待存入数据中各条数据前;/n根据所述待存入数据中各条数据前添加的分区标识值,将所述各条数据存入对应分区中。/n
【技术特征摘要】
1.一种大数据分区存储方法,其特征在于,所述方法包括:
获取待存入数据的占用存储空间,根据所述占用存储空间以及目标数据表每个分区的数据存储容量,对所述目标数据表的待存入数据进行分区,并得到每个分区的分区标识值,所述分区为分配多个存储区域进行数据的存储;
将所述待存入数据中各条数据的首字符与所述每个分区的分区标识值之间建立映射关系;
根据所述各条数据的首字符,利用所述映射关系,确定所述待存入数据中各条数据所对应的分区标识值;
根据所述映射关系,将所述每个分区的分区标识值添加到所述待存入数据中各条数据前;
根据所述待存入数据中各条数据前添加的分区标识值,将所述各条数据存入对应分区中。
2.根据权利要求1所述的方法,其特征在于,所述分区标识值包括起始标识值和结束标识值;
所述将所述待存入数据中各条数据的首字符与所述每个分区的分区标识值之间建立映射关系包括:
将所述待存入数据中各条数据的首字符与所述每个分区的起始标识值之间建立映射关系。
3.根据权利要求1所述的方法,其特征在于,在获取待存入数据的占用存储空间时,还获取所述目标数据表的名称;
所述根据所述待存入数据中各条数据前添加的分区标识值,将所述各条数据存入对应分区中包括:
根据目标数据表的名称,确定数据待存入的目标数据表;
根据所述待存入数据中各条数据前添加的分区标识值,确定所述待存入数据的分区;
将所述添加分区标识值的各条数据根据字段名称、字段值和唯一标识存入所述目标数据表的对应分区的相应位置。
4.根据权利要求1所述的方法,其特征在于,所述将所述待存入数据中各条数据的首字符与所述每个分区的分区标识值之间建立映射关系包括:
根据所述待存入数据中各条数据的首字符在所述目标数据表中出现的频度,确定所述待存入数据中各条数据的首字符对应的分区标识值,保证所述待存入数据的占用存储空间在所述每个分区均匀分布。
5.根据权利要求1所述的方法,其特征在于,所述映射关系存储在第一数据库的数据字典表中,所述数据字典表的名称为目标数据表的名称;
所述根据所述各条数据的首字符,利用所述映射关系,确定所述待存入数据中各条数据所对应的分区标识值包括:
根据所述目标数据表的名称,得到所述第一数据库的数据字典表的名称,确定所述第一数据库的数据字典表;
在所述数据字典表中,根据所述各条数据的首字符查询对应的所述分区标识值。
6.一种大数据分区查询方法,其特征在于,所述方法包括:
获取用户输入的目标数据表的名称和查询数据;
根据所述目标数据表的名称,得到第一数据库的数据字典表的名称,确定所述第一数据库的数据字典表,所述数据字典表存储有所述...
【专利技术属性】
技术研发人员:许吉来,孔亮,罗晓峰,丁杨,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。