文件处理方法、装置、设备、介质及产品制造方法及图纸

技术编号:32287833 阅读:18 留言:0更新日期:2022-02-12 19:56
本公开提供了文件处理方法、装置、设备、介质及产品,涉及人工智能技术领域,尤其涉及云计算领域。具体实现方案为:从磁盘存储介质中筛选满足迁移条件的目标用户的多个待迁移文件;将多个所述待迁移文件分别映射为数据对象,以获得所述目标用户对应的多个数据对象;将所述目标用户对应的多个所述数据对象进行数据聚合,得到目标数据块;将所述目标数据块存储至磁带存储介质中。本公开的技术方案有效降低了存储成本。降低了存储成本。降低了存储成本。

【技术实现步骤摘要】
文件处理方法、装置、设备、介质及产品


[0001]本公开涉及人工智能
中的云计算领域,尤其涉及一种文件处理方法、装置、设备、介质及产品。

技术介绍

[0002]随着移动互联网和人工智能的高速发展,个人云存储行业的数据规模越来越大。随着数据量的增大,数据的存储成本随之升高。现有的云存储技术,用户可以将本地数据传输至网盘中,由网盘实现数据的存储。网盘通常可以为HDD(Hard Disk Drive,硬盘驱动器)服务器,是一种磁盘存储器,所有用户数据存储于该HDD服务器上,提供毫秒级延迟的数据访问服务。但是现有的数据存储成本过高,消耗大量存储资源。

技术实现思路

[0003]本公开提供了一种用于网盘存储场景中文件处理的方法、装置、设备、介质及产品。
[0004]根据本公开的第一方面,提供了一种文件处理方法,包括:
[0005]从磁盘存储介质中筛选满足迁移条件的目标用户的多个待迁移文件;
[0006]将多个所述待迁移文件分别映射为数据对象,以获得所述目标用户对应的多个数据对象;
[0007]将所述目标用户对应的多个所述数据对象进行数据聚合,得到目标数据块;
[0008]将所述目标数据块存储至磁带存储介质中。
[0009]根据本公开的第二方面,提供了一种文件处理装置,包括:
[0010]文件选择单元,用于从磁盘存储介质中筛选满足迁移条件的目标用户的多个待迁移文件;
[0011]文件映射单元,用于将多个所述待迁移文件分别映射为数据对象,以获得所述目标用户对应的多个数据对象;
[0012]数据聚合单元,用于将所述目标用户对应的多个所述数据对象进行数据聚合,得到目标数据块;
[0013]数据存储单元,用于将所述目标数据块存储至磁带存储介质中。
[0014]根据本公开的第三方面,提供了一种电子设备,包括:
[0015]至少一个处理器;以及
[0016]与所述至少一个处理器通信连接的存储器;其中,
[0017]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行磁盘方面所述的文件处理方法。
[0018]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行磁盘方面所述的文件处理方法。
[0019]根据本公开的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:
计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行磁盘方面所述的方法。
[0020]根据本公开的技术解决了文件存储于磁盘存储介质,而导致的存储成本过高的问题,通过将磁盘存储介质中满足迁移条件的文件迁移至磁带存储介质中,磁带存储介质的存储成本更低。而在迁移过程中,采用文件选择以及聚合方案,实现文件的快速迁移。
[0021]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0022]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0023]图1是根据本公开实施例提供的文件处理方法的一个网络架构图
[0024]图2是根据本公开第一实施例提供的文件处理方法的流程图;
[0025]图3是根据本公开第二实施例提供的文件处理方法的流程图;
[0026]图4是数据块存储结构的示意图;
[0027]图5是根据本公开第三实施例提供的文件处理方法的流程图;
[0028]图6是根据本公开第四实施例提供的文件处理方法的流程图;
[0029]图7是根据本公开第五实施例提供的文件处理装置的示意图;
[0030]图8是用来实现本公开实施例的文件处理方法的电子设备的框图。
具体实施方式
[0031]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0032]本公开的技术方案可以应用于个人云存储场景中,主要是筛选磁盘存储介质中的冷数据,然后将冷数据迁移存储至磁带存储介质中,采用将文件拆分为数据分片的方式可以实现文件的快速迁移。本公开的技术方案在降低存储成本同时实现快速迁移。
[0033]随着移动互联网和人工智能技术的快速发展,个人云储存业务的规模越来越庞大,因此产生大量的个人存储数据。随着存储数量的增多,存储成本随之增加。个人云存储业务主要是将用户数据存储于HDD(Hard Disk Drive,硬盘驱动器)服务器中,以为用户提供快速的数据访问服务。但是,HDD服务器实际是一种磁盘存储器,存储成本较高。
[0034]为了解决磁盘存储器的存储成本过高的问题,本方案中考虑将磁盘存储系统中的数据迁移到成本较低的磁带存储系统中。磁带这种存储介质的成本低于存储成本,且磁带存储器的存储密度增长速度远高于磁盘,存储成本下降空间更大。而若将磁盘存储系统中的所有数据均迁移到磁带存储系统,在用户访问时,需要从磁带存储系统中读取数据,导致数据的读取速度过低。而在实际应用中,在磁盘存储系统中数据,95%以上的数据很久不会访问,可以称之为“冷数据”,被频繁访问的数据,例如,公共数据,可以称之为“热数据”。因此,本公开实施例中,考虑按照访问热度和访问延时的需求,分别存储在不同的存储介质
中。将冷数据迁移至磁带存储系统中。
[0035]本公开提供一种文件处理方法、装置、设备、介质及产品,应用于人工智能
中的云计算领域,特别是涉及云存储领域和云分布(简称:CDN,Content Delivery Network)领域,以达到降低存储成本,减少存储资源的大量消耗的技术问题。
[0036]本公开实施例中,可以从磁盘存储介质中筛选满足迁移条件的目标用户的多个待迁移文件,以将多个待迁移文件分别映射为数据对象,获得目标用户对应的多个数据对象。多个数据对象即为目标用户待存储的数据对象。进而将目标用户对应的多个数据对象数据聚合为至少一个目标存储块之后,将可以将至少一个目标存储块存储至磁带存储介质中,实现目标存储块的快速而准确的存储。通过满足迁移条件的待迁移文件进行筛选,可以对待写入的文件进行准确选择,之后通过数据聚合方式,将一个用户的多个文件聚合到目标数据块中,使得目标用户的文件存储聚合于目标数据块,确保至少一个数据块可以被快速写入磁带存储介质的目标存储块,磁盘存储介质的存储成本高于磁带存储介质的存储成本,进而通过数据迁移降低存储成本以减少存储资源的消耗的同时,快速实现数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件处理方法,包括:从磁盘存储介质中筛选满足迁移条件的目标用户的多个待迁移文件;将多个所述待迁移文件分别映射为数据对象,以获得所述目标用户对应的多个数据对象;将所述目标用户对应的多个所述数据对象进行数据聚合,得到目标数据块;将所述目标数据块存储至磁带存储介质中。2.根据权利要求1所述的方法,其中,所述将所述目标用户对应的多个数据对象进行数据聚合,得到目标数据块,包括:确定待写入数据块;从所述目标用户对应的多个数据对象中,确定当前的待写入对象;在所述待写入数据块的写入状态处于可写入状态时,将所述待写入对象写入所述待写入数据块;获取所有待写入数据块写入结束获得的所述目标数据块。3.根据权利要求2所述的方法,还包括:检测所述待写入对象写入完毕时所述待写入数据块的写入状态;所述写入状态包括:可写入状态或者写满状态;若所述写入状态为可写入状态,返回所述从所述目标用户对应的多个数据对象中,确定当前待写入对象的步骤继续执行,直至所述目标用户的所述多个数据对象写入完毕,获得写入结束时的目标数据块;若所述写入状态为写满状态,确定所述待写入数据块写满后的目标数据块,并返回至所述确定待写入数据块的步骤继续执行。4.根据权利要求3所述的方法,其中,所述在所述待写入数据块处于可写入状态时,将所述待写入对象写入所述待写入数据块,包括:为所述待写入对象生成写入标识;在所述待写入数据块处于可写入状态时,建立所述写入标识与所述待写入数据块的写入关联;基于所述写入关联,将所述待写入对象按照所述写入标识写入所述待写入数据块。5.根据权利要求4所述的方法,其中,所述直至所述目标用户的所述多个数据对象写入完毕,获得写入完成的目标数据块之后,还包括:检测所述多个数据对象写入完毕时所述待写入数据块的写入状态;若所述待写入数据块的写入状态为可写入状态,则返回至所述从磁盘存储介质中筛选满足迁移条件的目标用户的多个待迁移文件的步骤继续执行。6.根据权利要求5所述的方法,其中,所述若所述待写入数据块的写入状态为可写入状态,则返回至所述从磁盘存储介质中筛选满足迁移条件的目标用户的多个待迁移文件的步骤继续执行之后,所述为所述待写入对象生成写入标识,包括:获取所述待写入数据块关联的写入标识;将所述待写入数据块关联的所述写入标识作为新获得的目标用户所对应的当前待写入对象的写入标识。7.根据权利要求4

6任一项所述的方法,其中,所述若所述写入状态为可写入状态,返
回所述从所述目标用户对应的多个数据对象中,确定当前待写入对象的步骤继续执行之后,所述为所述待写入对象生成写入标识,包括:获取所述待写入数据块关联的写入标识;将所述待写入数据块关联的所述写入标识作为所述目标用户新获得的所述待写入对象的写入标识。8.根据权利要求4

7任一项所述的方法,其中,所述基于所述写入关联,将所述待写入对象按照所述写入标识写入所述待写入数据块,包括:将所述待写入对象拆分为多个数据分片;将多个所述数据分片依次写入到所述写入标识关联的所述待写入数据块中。9.根据权利要求8所述的方法,其中,所述将所述待写入对象拆分为多个数据分片之后,还包括:确定所述多个数据分片分别对应的拆分标识;所述将所述多个数据分片按照所述写入标识依次写入到所述待写入数据块中,包括:按照所述多个数据分片分别对应的拆分标识,依次将所述多个数据分片写入到所述写入标识关联的所述待写入数据块中。10.根据权利要求8所述的方法,还包括:在所述待写入对象的多个所述数据分片按照所述写入标识写入所述待写入数据块的过程中,检测所述待写入数据块的写入状态;在任一个所述数据分片写入所述待写入数据块,检测所述待写入数据块的写入状态为写满状态时,确定新的待写入数据块;为所述待写入对象设置新的写入标识,以建立所述新的写入标识与所述新的待写入数据块的关联关系;将未写入的数据分片,按照所述新的写入标识依次写入到所述新的待写入数据块中,直至多个所述数据分片均写入到对应的待写入数据块,获得相应的目标数据块。11.根据权利要求2

10任一项所述的方法,其中,所述从所述目标用户对应的多个数据对象中,确定当前待写入对象,包括:确定所述目标用户对应的多个数据对象分别对应的写入顺序;按照多个所述数据对象分别对应的写入顺序,确定前一个写入完成的数据对象的下一个数据对象为当前待写入对象。12.根据权利要求1

11任一项所述的方法,其中,所述从磁盘存储介质中筛选满足迁移条件的目标用户的多个待迁移文件,包括:从所述磁盘存储介质中确定满足用户筛选条件的目标用户;从所述目标用户的所有文件中选择满足文件筛选条件的多个待迁移文件。13.根据权利要求12所述的方法,其中,所述从所述目标用户的所有文件中选择满足文件筛选条件的多个待迁移文件,包括:从所述目标用户的所有文件中选择属于预定文件类型的多个候选文件;基于所述多个候选文件分别对应的访问频率,从所述多个候选文件中确定访问频率小于预设访问频率阈值的所述多个待迁移文件。14.根据权利要求13所述的方法,其中,所述从所述目标用户的所有文件中选择属于预
定文件类型的多个候选文件,包括:获取所述目标用户名下的所有文件;从所述目标用户名下的所有文件中,确定多个未存在预设分享历史的文件;将多个所述未存在预设分享历史的文件确定为多个所述候选文件。15.根据权利要求1

14任一项所述的方法,还包括:确定所述磁盘存储介质接收的所述目标用户发起的文件访问请求;响应于所述文件访问请求,确定所述目标用户请求访问的目标文件;确定所述目标文件对应的目标数据对象,以查询所述目标数据对象所在的目标数据块;从所述磁带存储介质读取所述目标数据块,获得所述目标数据对象;将所述目标数据对象映射为所述目标文件,并发送所述目标文件至所述磁盘存储介质,以供所述磁盘存储介质为所述目标用户输出所述目标文件。16.一种文件处理装置,包括:文件选择单元,用于从磁盘存储介质中筛选满足迁移条件的目标用户的多个待迁移文件;文件映射单元,用于将多个所述待迁移文件分别映射为数据对象,以获得所述目标用户对应的...

【专利技术属性】
技术研发人员:李磊
申请(专利权)人:北京度友信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1