数据质量评分方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:44892706 阅读:32 留言:0更新日期:2025-04-08 00:31
本公开涉及数据质量评分方法、装置、设备、存储介质及产品,所述方法包括:响应于获取到数据集,将所述数据集中的每条数据分别作为待评分数据;基于预设基准模型确定每条所述待评分数据对应的模型更新参数;基于模型初始参数以及每条所述待评分数据对应的模型更新参数,确定每条所述待评分数据对应的模型参数变化量,所述模型初始参数包括所述预设基准模型的初始参数;基于每条所述待评分数据对应的模型参数变化量确定每条所述待评分数据的质量评分。本公开可以实现高效、准确地的数据质量评估,进而可以提高后续进行数据过滤的准确性和效率,且可以降低计算开销。

【技术实现步骤摘要】

本公开涉及数据处理,尤其涉及一种数据质量评分方法、装置、设备、存储介质及产品


技术介绍

1、在机器学习等领域,数据质量的好坏直接影响着模型的训练效果和性能。随着数据规模的扩大和应用场景的日益复杂化,如何有效地识别和过滤低质量数据已成为一个亟待解决的关键问题。传统的数据过滤方法往往依赖于人工制定的规则或简单的统计特征,不仅需要耗费大量的人力资源,而且难以适应不同场景下的数据特点。


技术实现思路

1、有鉴于此,本公开提出一种数据质量评分方法、装置、设备、存储介质及产品以解决上述技术问题。

2、为了达到上述目的,本公开所采用的技术方案为:

3、根据本公开实施例的第一方面,提出了一种数据质量评分方法,所述方法包括:

4、响应于获取到数据集,将所述数据集中的每条数据分别作为待评分数据;

5、基于预设基准模型确定每条所述待评分数据对应的模型更新参数;

6、基于模型初始参数以及每条所述待评分数据对应的模型更新参数,确定每条所述待评分数据对应的模型参数变化量,所述本文档来自技高网...

【技术保护点】

1.一种数据质量评分方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设基准模型确定每条所述待评分数据对应的模型更新参数,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于每条所述待评分数据分别训练所述克隆基准模型,得到每条所述待评分数据对应的模型更新参数,包括:

4.根据权利要求2所述的方法,其特征在于,所述模型初始参数和所述模型更新参数均为目标关键层的参数,所述目标关键层为在所述克隆基准模型中预先指定的需要监控的关键层。

5.根据权利要求4所述的方法,其特征在于,所述目标关键层的参数包括所述目...

【技术特征摘要】

1.一种数据质量评分方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于预设基准模型确定每条所述待评分数据对应的模型更新参数,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于每条所述待评分数据分别训练所述克隆基准模型,得到每条所述待评分数据对应的模型更新参数,包括:

4.根据权利要求2所述的方法,其特征在于,所述模型初始参数和所述模型更新参数均为目标关键层的参数,所述目标关键层为在所述克隆基准模型中预先指定的需要监控的关键层。

5.根据权利要求4所述的方法,其特征在于,所述目标关键层的参数包括所述目标关键层的权重矩阵和偏置向量。

6.根据权利要求2所述的方法,其特征在于,所述基于模型初始参数以及每条所述待评分数据对应的模型更新参数,确定每条所述待评分数据对应的模型参数变化量,包括...

【专利技术属性】
技术研发人员:涂泽傲孟祥狄贺宇李明
申请(专利权)人:深圳市星桐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1