一种指标数据质量评估方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38675931 阅读:9 留言:0更新日期:2023-09-02 22:51
本发明专利技术公开了一种指标数据质量评估方法、装置、电子设备及存储介质,用于解决现有的指标数据评估方法容易出现错漏的技术问题。本发明专利技术包括:获取未知指标的属性信息;根据所述属性信息分别计算所述未知指标与多个预设的已知指标的距离;根据所述距离在所述已知指标中确定若干个目标指标;获取各所述目标指标的分类标签,并根据所述分类标签确定所述未知指标的数据质量。本发明专利技术通过计算未知指标与已知指标的距离,来判断未知指标归属于哪一类分类标签,从而根据分类标签确定数据质量,无需人工参与,减少了评估错漏的情况。减少了评估错漏的情况。减少了评估错漏的情况。

【技术实现步骤摘要】
一种指标数据质量评估方法、装置、电子设备及存储介质


[0001]本专利技术涉及质量评估
,尤其涉及一种指标数据质量评估方法、装置、电子设备及存储介质。

技术介绍

[0002]在企业运营中,需要从产品的发展、收入、活跃、使用、支撑营销等维度采集相应数据,完成公司级、和集团级数据的汇聚,以实现公司内部的数据共建共享。
[0003]而在企业层面中,汇聚得到的数据量是庞大的,且在采集得到的数据中,存在了各式各样的指标数据。不同的指标数据的质量良莠不齐,通常需要市场部门根据经验分辨各个指标的数据质量。
[0004]然而,依据员工经验来分辨指标的数据质量容易出现错漏的情况,导致对市场决策产生负面影响。

技术实现思路

[0005]本专利技术提供了一种指标数据质量评估方法、装置、电子设备及存储介质,用于解决现有的指标数据评估方法容易出现错漏的技术问题。
[0006]本专利技术提供了一种指标数据质量评估方法,包括:
[0007]获取未知指标的属性信息;
[0008]根据所述属性信息分别计算所述未知指标与多个预设的已知指标的距离;
[0009]根据所述距离在所述已知指标中确定若干个目标指标;
[0010]获取各所述目标指标的分类标签,并根据所述分类标签确定所述未知指标的数据质量。
[0011]可选地,所述属性信息包括若干个指标属性;所述指标属性包括指标环比、指标同比、指标均值、指标中位值、指标方差、指标标准差和指标空值。
[0012]可选地,所述根据所述属性信息分别计算所述未知指标与多个预设的已知指标的距离的步骤,包括:
[0013]获取与所述指标属性对应的所述已知指标的目标属性;
[0014]分别计算各指标属性与对应的目标属性之间的差值的平方,得到属性差;
[0015]将所述未知指标的所有指标属性与目标属性对应的属性差相加,得到属性差和;
[0016]对所述属性差和进行开平方,得到所述未知指标与所述已知指标之间的距离。
[0017]可选地,所述获取各所述目标指标的分类标签,并根据所述分类标签确定所述未知指标的数据质量的步骤,包括:
[0018]获取各所述目标指标的分类标签,将数量最多的分类标签对应的数据质量作为所述未知指标的数据质量。
[0019]本专利技术还提供了一种指标数据质量评估装置,包括:
[0020]属性信息获取模块,用于获取未知指标的属性信息;
[0021]距离计算模块,用于根据所述属性信息分别计算所述未知指标与多个预设的已知指标的距离;
[0022]目标指标确定模块,用于根据所述距离在所述已知指标中确定若干个目标指标;
[0023]数据质量确定模块,用于获取各所述目标指标的分类标签,并根据所述分类标签确定所述未知指标的数据质量。
[0024]可选地,所述属性信息包括若干个指标属性;所述指标属性包括指标环比、指标同比、指标均值、指标中位值、指标方差、指标标准差和指标空值。
[0025]可选地,所述距离计算模块,包括:
[0026]目标属性获取子模块,用于获取与所述指标属性对应的所述已知指标的目标属性;
[0027]属性差计算子模块,用于分别计算各指标属性与对应的目标属性之间的差值的平方,得到属性差;
[0028]属性差和计算子模块,用于将所述未知指标的所有指标属性与目标属性对应的属性差相加,得到属性差和;
[0029]距离计算子模块,用于对所述属性差和进行开平方,得到所述未知指标与所述已知指标之间的距离。
[0030]可选地,所述数据质量确定模块,包括:
[0031]数据质量确定子模块,用于获取各所述目标指标的分类标签,将数量最多的分类标签对应的数据质量作为所述未知指标的数据质量。
[0032]本专利技术还提供了一种电子设备,所述设备包括处理器以及存储器:
[0033]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0034]所述处理器用于根据所述程序代码中的指令执行如上任一项所述的指标数据质量评估方法。
[0035]本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行如上任一项所述的指标数据质量评估方法。
[0036]从以上技术方案可以看出,本专利技术具有以下优点:本专利技术提供了一种指标数据质量评估方法,包括:获取未知指标的属性信息;根据属性信息分别计算未知指标与多个预设的已知指标的距离;根据距离在已知指标中确定若干个目标指标;获取各目标指标的分类标签,根据分类标签确定未知指标的数据质量。
[0037]本专利技术通过计算未知指标与已知指标的距离,来判断未知指标归属于哪一类分类标签,从而根据分类标签确定数据质量,无需人工参与,减少了评估错漏的情况。
附图说明
[0038]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0039]图1为本专利技术实施例提供的一种指标数据质量评估方法的步骤流程图;
[0040]图2为本专利技术另一实施例提供的一种指标数据质量评估方法的步骤流程图;
[0041]图3为本专利技术实施例提供的一种指标数据质量评估装置的结构框图。
具体实施方式
[0042]本专利技术实施例提供了一种指标数据质量评估方法、装置、电子设备及存储介质,用于解决现有的指标数据评估方法容易出现错漏的技术问题。
[0043]为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0044]请参阅图1,图1为本专利技术实施例提供的一种指标数据质量评估方法的步骤流程图。
[0045]本专利技术提供的一种指标数据质量评估方法,具体可以包括以下步骤:
[0046]步骤101,获取未知指标的属性信息;
[0047]在本专利技术实施例中,可以根据指标数据的属性信息来对未知指标进行类型划分。其中,指标数据的属性信息可以包括准确性指标、一致性指标、完整性指标和即时性指标。
[0048]步骤102,根据属性信息分别计算未知指标与多个预设的已知指标的距离;
[0049]在本专利技术实施例中,可以采用k近邻法计算得到与未知指标最接近的若干个目标指标,首先可以先根据属性信息分别计算未知指标与多个预设的已知指标之间的距离。
[0050]未知指标与已知指标之间的距离可以为两者之间的欧氏距离。
[005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种指标数据质量评估方法,其特征在于,包括:获取未知指标的属性信息;根据所述属性信息分别计算所述未知指标与多个预设的已知指标的距离;根据所述距离在所述已知指标中确定若干个目标指标;获取各所述目标指标的分类标签,并根据所述分类标签确定所述未知指标的数据质量。2.根据权利要求1所述的方法,其特征在于,所述属性信息包括若干个指标属性;所述指标属性包括指标环比、指标同比、指标均值、指标中位值、指标方差、指标标准差和指标空值。3.根据权利要求2所述的方法,其特征在于,所述根据所述属性信息分别计算所述未知指标与多个预设的已知指标的距离的步骤,包括:获取与所述指标属性对应的所述已知指标的目标属性;分别计算各指标属性与对应的目标属性之间的差值的平方,得到属性差;将所述未知指标的所有指标属性与目标属性对应的属性差相加,得到属性差和;对所述属性差和进行开平方,得到所述未知指标与所述已知指标之间的距离。4.根据权利要求1所述的方法,其特征在于,所述获取各所述目标指标的分类标签,并根据所述分类标签确定所述未知指标的数据质量的步骤,包括:获取各所述目标指标的分类标签,将数量最多的分类标签对应的数据质量作为所述未知指标的数据质量。5.一种指标数据质量评估装置,其特征在于,包括:属性信息获取模块,用于获取未知指标的属性信息;距离计算模块,用于根据所述属性信息分别计算所述未知指标与多个预设的已知指标的距离;目标指标确定模块,用于根据所述距离在所述已知指标中确定若干个目标指标;数据质量确定模块...

【专利技术属性】
技术研发人员:汤嘉诚
申请(专利权)人:天翼数字生活科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1