数据集合处理方法、装置和系统制造方法及图纸

技术编号：27876282 阅读：26 留言：0更新日期：2021-03-31 00:51

本发明专利技术提出一种数据集合处理方法、一种数据集合处理装置和一种数据集合处理系统，所述方法包括：获取初始数据集合的集合大小和集合行数；根据预设内存容量、所述集合大小和所述集合行数得到数据加载行数；根据预设读取单位从所述初始数据集合中读取数据得到第一数据量；判断所述第一数据量的行数是否大于所述数据加载行数，当判断所述第一数据量的行数不大于所述数据加载行数时，将所述第一数据量保存至目标数据集合中。本发明专利技术实施例提供的数据集合处理方法可以避免通过设置内存不受限直接将大数据集合拆分后重新融合成新的数据集合造成的服务器运行脚本异常问题。

全部详细技术资料下载

【技术实现步骤摘要】
数据集合处理方法、装置和系统
本专利技术涉及大数据
，尤其涉及一种数据集合处理方法、一种数据集合处理装置和一种数据集合处理系统。
技术介绍
目前，每个项目涉及的大数据集合由于占用磁盘空间过大，从而导致无法有效的释放大数据集合占用的磁盘空间；此外大数据集合所占用服务器资源开销过大，增加服务器资源成本；且大数据集合中历史数据和活跃数据处于共存状态，无法有效地将历史数据归档存储，从而影响历史问题排查分析。现有相关技术中通过设置内存不受限直接将大数据集合拆分后重新融合成新的数据集合，如此一来运行内存在高突发数据情况下会溢出，造成服务器脚本异常的情况，同时这种方式还会存在一定的服务器风险。
技术实现思路
因此，本专利技术提出一种数据集合处理方法、一种数据集合处理装置和一种数据集合处理系统，以避免现有相关技术中通过设置内存不受限直接将大数据集合拆分后重新融合成新的数据集合造成的服务器运行脚本异常问题。具体地，第一方面，本专利技术实施例提出一种数据集合处理方法，包括：获取初始数据集合的集合大小和集合行数；根据预设内存容量、所述集合大小和所述集合行数得到数据加载行数；根据预设读取单位从所述初始数据集合中读取数据得到第一数据量；判断所述第一数据量的行数是否大于所述数据加载行数，当判断所述第一数据量的行数不大于所述数据加载行数时，将所述第一数据量保存至目标数据集合中。在现有技术中，通过设置内存不受限直接将大数据集合拆分后重新融合成新的数据集合，如此一来运行内存在高突发数据情况下会溢出，造...

【技术保护点】
1.一种数据集合处理方法，其特征在于，包括：/n获取初始数据集合的集合大小和集合行数；/n根据预设内存容量、所述集合大小和所述集合行数得到数据加载行数；/n根据预设读取单位从所述初始数据集合中读取数据得到第一数据量；/n判断所述第一数据量的行数是否大于所述数据加载行数，当判断所述第一数据量的行数不大于所述数据加载行数时，将所述第一数据量保存至目标数据集合中。/n

【技术特征摘要】
1.一种数据集合处理方法，其特征在于，包括：
获取初始数据集合的集合大小和集合行数；
根据预设内存容量、所述集合大小和所述集合行数得到数据加载行数；
根据预设读取单位从所述初始数据集合中读取数据得到第一数据量；
判断所述第一数据量的行数是否大于所述数据加载行数，当判断所述第一数据量的行数不大于所述数据加载行数时，将所述第一数据量保存至目标数据集合中。

2.根据权利要求1所述的数据集合处理方法，其特征在于，所述根据预设内存容量、所述集合大小和所述集合行数计算得到数据加载行数，包括：
根据所述集合大小和所述集合行数计算得到每行数据大小；
根据所述预设内存容量和所述每行数据大小计算得到所述数据加载行数。

3.根据权利要求1所述的数据集合处理方法，其特征在于，还包括：
当判断所述第一数据量的行数大于所述数据加载行数时，修改所述预设读取单位得到第一目标读取单位，根据所述第一目标读取单位从所述初始数据集合中读取数据得到第二数据量；
判断所述第二数据量的行数是否大于所述数据加载行数，当判断所述第二数据量的行数不大于所述数据加载行数时，将所述第二数据量保存至所述目标数据集合中。

4.根据权利要求3所述的数据集合处理方法，其特征在于，所述修改所述预设读取单位得到第一目标读取单位包括：将所述预设读取单位拆分为相等的第一时间长度和第二时间长度，并所述第一时间长度作为所述第一目标读取单位。

5.根据权利要求4所述的数据集合处理方法，其特征在于，还包括：
将所述预设读取单位的所述第二时间长度作为第二目标读取单位；
根据所述第二目标读取单位从所述初始数据集合中读取数据得到第三数据量；
判断所述第三数据量的行数是否大于所述数据加载行数，当判断所述第三数据量的行数...

【专利技术属性】
技术研发人员：李强，陈庆东，韩丹，
申请(专利权)人：西安诺瓦星云科技股份有限公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人