一种基于算法模型评估数据质量的方法技术

技术编号:44716915 阅读:21 留言:0更新日期:2025-03-21 17:46
本发明专利技术公开了一种基于算法模型评估数据质量的方法,主要解决现有数据评估方法评估过程的通用性、客观性和准确性受限的问题。该方法包括以下步骤:S1,获取待评估的数据,并将所述数据输入到建立数据评估指标规则的算法模型中;S2,通过Z‑score目标离群点方法识别、标记离群值,记录空值;S3,通过leave‑one‑out方法,计算符合设定精度标准的数据比例,对数据进行逐条评估检测;S4,基于数据完整性调整数据质量得分。通过上述设计,本发明专利技术采用leave‑one‑out方法能够对数据进行逐条评估检测,全面识别并剔除离群点,极大地提升评估过程的通用型、客观性和准确性。

【技术实现步骤摘要】

本专利技术属于机器学习,具体地说,是涉及一种基于算法模型评估数据质量的方法


技术介绍

1、在当今数字化时代,数据已成为企业和组织的核心资产,随着业务的不断拓展和信息化程度的加深,数据量呈爆炸式增长,数据类型也日益多样化。

2、目前工业领域对数据的价值进行评估的时候,通常是基于数据来进行的;数据的质量在很大程度上能够影响其价值的评估结果。因此,在对数据的价值进行评估之前,通常需要对数据的质量进行评估确定。


技术实现思路

1、本专利技术的目的在于提供一种基于算法模型评估数据质量的方法,主要解决现有数据评估方法评估过程的客观性和准确性受限的问题。

2、为实现上述目的,本专利技术采用的技术方案如下:

3、一种基于算法模型评估数据质量的方法,包括以下步骤:

4、s1,获取待评估的数据,并将所述数据输入到建立数据评估指标规则的算法模型中;

5、s2,通过z-score目标离群点方法识别、标记离群值,记录空值;

6、s3,通过leave-one-ou本文档来自技高网...

【技术保护点】

1.一种基于算法模型评估数据质量的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于算法模型评估数据质量的方法,其特征在于,在所述步骤S3中,采用完整目标数据计算方法和不完整目标数据加权计算方法相结合的方法对数据进行逐条评估检测。

3.根据权利要求2所述的一种基于算法模型评估数据质量的方法,其特征在于,在所述步骤S2中,Z-score目标离群点方法包括以下步骤:

4.根据权利要求3所述的一种基于算法模型评估数据质量的方法,其特征在于,采用完整目标数据计算方法对第i条数据Di∈Rm和对应的目标yi∈R进行质量检验包括以下步骤:

...

【技术特征摘要】

1.一种基于算法模型评估数据质量的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于算法模型评估数据质量的方法,其特征在于,在所述步骤s3中,采用完整目标数据计算方法和不完整目标数据加权计算方法相结合的方法对数据进行逐条评估检测。

3.根据权利要求2所述的一种基于算法模型评估数据质量的方法,其特征在于,在所述步骤...

【专利技术属性】
技术研发人员:刘雨阳
申请(专利权)人:幻量材料科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1