This application relates to a data storage method, device, computer equipment and storage medium. The method includes: acquiring a file to be stored which includes multiple data segments; reading each data segment in sequence according to the data segment in the file to be stored; counting the number of data segments when there is a valid data segment in the data segment; storing the valid data segment in the data segment and recording the storage offset corresponding to the valid data segment in the stored data segment. According to the storage offset of records and the number of data in the effective data segment of statistics, the index segment corresponding to the effective data segment of storage is generated until the data segment in the file to be stored is read out; and the index file corresponding to the file to be stored is generated according to the index segment generated. When using this method to store data, only the effective data segments in the data segments are stored, which saves the storage space.
【技术实现步骤摘要】
数据存储方法、装置、计算机设备和存储介质
本申请涉及数据处理
,特别是涉及一种数据存储方法、装置、计算机设备和存储介质。
技术介绍
随着数据处理技术的发展,需要经常对一些数据进行存储,出现了位图技术。通过位图技术可以将大量的数据以位图的形式进行存储,位图中的每一位可以表示一个数据。然而,传统的位图技术会对所有数据对应的位图进行存储。当数据中存在大量无效数据的情况时,仍然会对大量无效数据对应的位图进行存储,占用了较多的存储空间,造成了存储空间的浪费。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够节约存储空间的数据存储方法、装置、计算机设备和存储介质。一种数据存储方法,所述方法包括:获取包括多个数据段的待存储文件;按照所述待存储文件中数据段顺序依次读取每个数据段;当识别到所述读取到的数据段中存在有效数据段部分时,统计所述有效数据段部分的数据数量;存储所述读取到的数据段中的有效数据段部分,并记录存储的有效数据段部分对应的存储偏移量;根据记录的存储偏移量和统计的有效数据段部分的数据数量,生成存储的有效数据段部分对应的索引段,直至所述待存储文件中的数据段被读取完毕;根据生成的索引段生成所述待存储文件对应的索引文件。一种数据存储装置,其特征在于,所述装置包括:文件获取模块,用于获取包括多个数据段的待存储文件;数据读取模块,用于按照所述待存储文件中数据段顺序依次读取每个数据段;数量统计模块,用于当识别到所述读取到的数据段中存在有效数据段部分时,统计所述有效数据段部分的数据数量;数据存储模块,用于存储所述读取到的数据段中的有效数据段部分,并记录存储的有效数 ...
【技术保护点】
1.一种数据存储方法,所述方法包括:获取包括多个数据段的待存储文件;按照所述待存储文件中数据段顺序依次读取每个数据段;当识别到所述读取到的数据段中存在有效数据段部分时,统计所述有效数据段部分的数据数量;存储所述读取到的数据段中的有效数据段部分,并记录存储的有效数据段部分对应的存储偏移量;根据记录的存储偏移量和统计的有效数据段部分的数据数量,生成存储的有效数据段部分对应的索引段,直至所述待存储文件中的数据段被读取完毕;根据生成的索引段生成所述待存储文件对应的索引文件。
【技术特征摘要】
1.一种数据存储方法,所述方法包括:获取包括多个数据段的待存储文件;按照所述待存储文件中数据段顺序依次读取每个数据段;当识别到所述读取到的数据段中存在有效数据段部分时,统计所述有效数据段部分的数据数量;存储所述读取到的数据段中的有效数据段部分,并记录存储的有效数据段部分对应的存储偏移量;根据记录的存储偏移量和统计的有效数据段部分的数据数量,生成存储的有效数据段部分对应的索引段,直至所述待存储文件中的数据段被读取完毕;根据生成的索引段生成所述待存储文件对应的索引文件。2.根据权利要求1所述的方法,其特征在于,所述当识别到所述读取到的数据段中存在有效数据段部分时,统计所述有效数据段部分的数据数量包括:按照读取到的数据段中数据排列顺序依次识别整型数据;当识别到的整型数据为有效整型数据时,获取所述有效整型数据在所述待存储文件中的位置序号;当识别到的整型数据为所述读取到的数据段中的第一个有效整型数据时,根据获取到的位置序号,确定所述读取到的数据段中无效数据段部分的数据数量;根据所述获取到的位置序号和所述无效数据段部分的数据数量,统计有效数据段部分的数据数量。3.根据权利要求1所述的方法,其特征在于,所述存储所述读取到的数据段中的有效数据段部分,并记录存储的有效数据段部分对应的存储偏移量包括:获取前次存储的有效数据段部分对应的索引段;从获取的索引段中提取所述前次存储的有效数据段部分所对应的数据数量和存储偏移量;根据提取到的数据数量和存储偏移量,确定当前有效数据段部分对应的存储偏移量;根据所述当前有效数据段部分对应的存储偏移量,存储所述读取到的数据段中有效数据段部分,并记录存储的有效数据段部分对应的存储偏移量。4.根据权利要求1所述的方法,其特征在于,所述根据记录的存储偏移量和统计的有效数据段部分的数据数量,生成存储的有效数据段部分对应的索引段,直至所述待存储文件中的数据段被读取完毕包括:获取所述读取到数据段中头部无效数据段部分的数据数量;根据获取的头部无效数据段部分的数据数量、记录的存储偏移量和统计的有效数据段部分的数据数量,生成存储的有效数据段部分对应的索引段,直至所述待存储文件中的数据段被读取完毕。5.根据权利要求1所述的方法,其特征在于,所述根据生成的索引段生成所述待存储文件对应的索引文件之后,还包括:获取数据查询指令;确定所述数据查询指令中的位置序号对应的段编号;在所述索引文件提取与所述段编号对应的索引...
【专利技术属性】
技术研发人员:谈少民,
申请(专利权)人:金蝶软件中国有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。