垃圾数据清理方法、装置、设备和存储介质制造方法及图纸

技术编号:43758827 阅读:34 留言:0更新日期:2024-12-24 16:03
本申请涉及一种垃圾数据清理方法、装置、设备和存储介质。该方法包括:监控云原生应用产生的数据;根据数据对应的记录,确定数据对应的统计特征;根据数据的数据类型,在数据中,提取数据特征;使用预先训练的垃圾数据识别模型根据统计特征和数据特征,对数据进行垃圾数据识别并输出识别结果;在识别结果表示数据为垃圾数据时,针对数据执行垃圾数据清理任务。本申请收集可以用于反应数据本身的数据特征以及用于反映数据重要性的统计特征,使用垃圾数据识别模型自适应多样化的数据并且利用数据特征和统计特征识别潜在的垃圾数据,避免出现误删重要数据或遗漏垃圾数据的问题,并且从源头上避免了在云存储系统中存储垃圾数据的问题。

【技术实现步骤摘要】

本申请涉及数据存储,尤其涉及一种垃圾数据清理方法、装置、设备和存储介质


技术介绍

1、由于云原生应用的快速发展,导致云存储系统中的数据量呈指数级增长。随着对云存储系统的不断使用,会在云存储系统中存储大量的垃圾数据,例如:临时文件,重复数据,无效数据等。如果不及时清理这些垃圾数据,那么这些垃圾数据不仅会浪费存储空间,还会影响数据的访问效率和安全性,增加了数据备份和迁移的成本。

2、目前,基本使用静态规则清理云存储系统中的垃圾数据。然而,静态规则容易误删重要数据或遗漏垃圾数据,造成这种问题的原因在于:静态规则具有固定性,不能实时分析云存储系统中的多样化数据,不会区分数据是否重要,而且静态规则需要耗费大量计算资源来识别垃圾数据,识别复杂度高,导致在识别过程中容易遗漏垃圾数据。


技术实现思路

1、本申请提供了一种垃圾数据清理方法、装置、设备和存储介质,以解决使用静态规则清理云存储系统中的垃圾数据,容易导致误删重要数据或遗漏垃圾数据的问题。

2、针对上述技术问题,本申请技术方案是通过如下实施例本文档来自技高网...

【技术保护点】

1.一种垃圾数据清理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,所述根据所述数据的数据类型,在所述数据中,提取数据特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述针对所述数据执行垃圾数据清理任务,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述响应于预设的模型训练触发事件,包括:

8.一种垃圾数据清理装...

【技术特征摘要】

1.一种垃圾数据清理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,所述根据所述数据的数据类型,在所述数据中,提取数据特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述针对所述数据执行垃圾数据清理任务,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述响应于预设的模型训练触发事件,包括:<...

【专利技术属性】
技术研发人员:干玲剑刘枫
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1