一种数据存储方法及装置、数据读取方法及装置、设备制造方法及图纸

技术编号：35498752 阅读：18 留言：0更新日期：2022-11-05 17:02

本发明专利技术公开了一种数据存储方法，该方法包括以下步骤：接收待存储的目标数据集；获取目标数据集中每项数据的数据大小；其中，目标数据集中各项数据的大小相同；将目标数据集中各项数据存储至硬盘中连续且大小相同的各目标区块；其中，各目标区块的区块大小根据数据大小确定。应用本发明专利技术所提供的数据存储方法，节省了数据读取的时间，提升了数据读写效率。本发明专利技术还公开了一种数据存储装置、数据读取方法及装置、设备及存储介质，具有相应技术效果。具有相应技术效果。具有相应技术效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据存储方法及装置、数据读取方法及装置、设备

[0001]本专利技术涉及数据处理
，特别是涉及一种数据存储方法及装置、数据读取方法及装置、设备及非易失性存储介质。

技术介绍

[0002]人工智能在近几年得到了快速发展，人工智能的机器学习需要对数据集进行收集，标记及预处理等。而后才能在机器学习与深度学习的训练与推论中被读取与使用。
[0003]然而数据集的读写对整体人工智能训练与推论的效能有可能有极大的负面影响，主要原因包括：（1）数据集依不同演算法的需求，其个数可能成千上万或更多 (每个都是例如图档，文字或语音)；（2）数据集需要经过预处理为可用的训练/测试数据写入硬盘；（3）数据集经过预处理后，通常每项数据都会变小，且其大小是固定的；（4）以上三步骤完成后，训练与推论的过程其实是“读取”成千上万小数据量的数据集数据，进行运算。也就是说要存取一个数据集，实际上需要执行很多系统程序，并且需要在硬盘中花费时间搜寻该数据集的所有数据项，以还原成原来的数据集。需要花费大量时间捜寻硬盘大部份不连续的区块，才能组合为原数据集，导致数据读写效率低。
[0004]综上所述，如何有效地解决花费大量时间捜寻硬盘大部份不连续的区块，才能组合为原数据集，导致数据读写效率低等问题，是目前本领域技术人员急需解决的问题。

技术实现思路

[0005]本专利技术的目的是提供一种数据存储方法，该方法节省了数据读取的时间，提升了数据读写效率；本专利技术的另一目的是提供一种数据存储装置、数据读取方法及装置、设备及非...

【技术保护点】

【技术特征摘要】
1.一种数据存储方法，其特征在于，包括：接收待存储的目标数据集；获取所述目标数据集中每项数据的数据大小；其中，所述目标数据集中各项数据的大小相同；将所述目标数据集中各项数据存储至硬盘中连续且大小相同的各目标区块；其中，各所述目标区块的区块大小根据所述数据大小确定。2.根据权利要求1所述的数据存储方法，其特征在于，在接收待存储的目标数据集之后，获取所述目标数据集中每项数据的数据大小之前，还包括：对所述目标数据集进行第一预处理操作；其中，所述第一预处理操作为未增加数据大小的预处理操作。3.根据权利要求2所述的数据存储方法，其特征在于，对所述目标数据集进行第一预处理操作，包括：对所述目标数据集进行除归一化预处理之外的预处理操作。4.根据权利要求1所述的数据存储方法，其特征在于，接收待存储的目标数据集，包括：接收待存储的用于人工智能模型训练的目标数据集。5.根据权利要求1所述的数据存储方法，其特征在于，获取所述目标数据集中每项数据的数据大小，包括：获取所述目标数据集中由数据本身、数据标签以及数据档名构成的每项数据的数据大小。6.根据权利要求1至5任一项所述的数据存储方法，其特征在于，还包括根据所述数据大小确定所述目标区块的区块大小的过程，根据所述数据大小确定所述目标区块的区块大小的过程，包括：获取预设的各可选区块大小；从大于所述数据大小的各所述可选区块大小中选取得到所述目标区块的区块大小。7.根据权利要求6所述的数据存储方法，其特征在于，从大于所述数据大小的各所述可选区块大小中选取得到所述目标区块的区块大小，包括：从大于所述数据大小的各所述可选区块大小中选取与所述数据大小差值最小的可选区块大小；将与所述数据大小差值最小的可选区块大小确定为所述目标区块的区块大小。8.根据权利要求6所述的数据存储方法，其特征在于，在获取预设的各可选区块大小之后，还包括：判断所述数据大小是否小于等于各所述可选区块大小中的最大值；若是，则执行所述从大于所述数据大小的各所述可选区块大小中选取得到所述目标区块的区块大小的步骤；若否，则将各所述可选区块大小中的最大值确定为所述目标区块的区块大小。9.一种数据读取方法，其特征在于，包括：接收数据读取命令；从硬盘中连续且大小相同的各目标区块中读取目标数据集的每项数据；其中，各所述目标区块的区块大小根据每项数据的数据大小确定，且所述目标数据集中各项数据的大小
相同；将读取到的各项数据返回给所述数据读取命令的发送端。10.根据权利要求9所述的数据读取方法，其特征在于，在从硬...

【专利技术属性】
技术研发人员：林楷智，蔡志恺，黄柏学，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人