【技术实现步骤摘要】
本专利技术属于机器学习,具体地说,是涉及一种基于算法模型评估数据质量的方法。
技术介绍
1、在当今数字化时代,数据已成为企业和组织的核心资产,随着业务的不断拓展和信息化程度的加深,数据量呈爆炸式增长,数据类型也日益多样化。
2、目前工业领域对数据的价值进行评估的时候,通常是基于数据来进行的;数据的质量在很大程度上能够影响其价值的评估结果。因此,在对数据的价值进行评估之前,通常需要对数据的质量进行评估确定。
技术实现思路
1、本专利技术的目的在于提供一种基于算法模型评估数据质量的方法,主要解决现有数据评估方法评估过程的客观性和准确性受限的问题。
2、为实现上述目的,本专利技术采用的技术方案如下:
3、一种基于算法模型评估数据质量的方法,包括以下步骤:
4、s1,获取待评估的数据,并将所述数据输入到建立数据评估指标规则的算法模型中;
5、s2,通过z-score目标离群点方法识别、标记离群值,记录空值;
6、s3,通过le
...【技术保护点】
1.一种基于算法模型评估数据质量的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于算法模型评估数据质量的方法,其特征在于,在所述步骤S3中,采用完整目标数据计算方法和不完整目标数据加权计算方法相结合的方法对数据进行逐条评估检测。
3.根据权利要求2所述的一种基于算法模型评估数据质量的方法,其特征在于,在所述步骤S2中,Z-score目标离群点方法包括以下步骤:
4.根据权利要求3所述的一种基于算法模型评估数据质量的方法,其特征在于,采用完整目标数据计算方法对第i条数据Di∈Rm和对应的目标yi∈R进行质量检验包括以
...
【技术特征摘要】
1.一种基于算法模型评估数据质量的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于算法模型评估数据质量的方法,其特征在于,在所述步骤s3中,采用完整目标数据计算方法和不完整目标数据加权计算方法相结合的方法对数据进行逐条评估检测。
3.根据权利要求2所述的一种基于算法模型评估数据质量的方法,其特征在于,在所述步骤...
【专利技术属性】
技术研发人员:刘雨阳,
申请(专利权)人:幻量材料科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。