【技术实现步骤摘要】
信息质量量化方法、装置、计算机设备和存储介质
本申请涉及信息质量评价
,特别是涉及一种信息质量量化方法、装置、设备和存储介质。
技术介绍
随着日常生活和生产制造中的用电需求持续增加、电力系统的飞速发展,智能变电站的使用更加普遍,从而导致智能变电站二次系统采集的数据信息量也持续增长。因此,在厂站端运行维护人员需要对智能变电站进行数据信息维护时,需要采用有价值的数据信息作为运行维护的判断依据,这就需要对智能变电站二次系统中海量的数据信息进行质量评价,得出有价值的数据信息。现有技术中对于智能变电站二次系统中的数据信息进行质量评价时,通常为专家根据经验对数据信息进行赋权评估,进而得到数据信息质量等级。然而,现有技术中的信息质量评价方法具有评价效率低和准确度低的问题。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够高效且准确评价信息质量的信息质量量化方法、装置、计算机设备和存储介质。第一方面,本申请提供一种信息质量量化方法,该方法包括:获取预设时间段内的变电站二次系 ...
【技术保护点】
1.一种信息质量量化方法,其特征在于,所述方法包括:/n获取预设时间段内的变电站二次系统的数据;/n采用基于混合蛙跳算法的聚类方法对所述数据进行聚类分析,得到多个数据集;/n根据至少两个预设评价指标对每个数据集进行量化分析,得到每个数据集在每个评价指标下的数据占比;/n根据每个数据集在每个评价指标下的数据占比和每个所述评价指标的目标权重,获取每个所述数据集的质量量化值。/n
【技术特征摘要】
1.一种信息质量量化方法,其特征在于,所述方法包括:
获取预设时间段内的变电站二次系统的数据;
采用基于混合蛙跳算法的聚类方法对所述数据进行聚类分析,得到多个数据集;
根据至少两个预设评价指标对每个数据集进行量化分析,得到每个数据集在每个评价指标下的数据占比;
根据每个数据集在每个评价指标下的数据占比和每个所述评价指标的目标权重,获取每个所述数据集的质量量化值。
2.根据权利要求1所述的方法,其特征在于,所述采用基于混合蛙跳算法的聚类方法对所述数据进行聚类分析,得到多个数据集,包括:
获取所述数据的聚类特征;
根据所述聚类特征计算第一均值距离和第二均值距离;所述第一均值距离为聚类簇中所有点到中心点的均值距离,第二均值距离为聚类簇中任意两点之间的均值距离;
根据聚类簇中样本点的归属程度、聚合度、所述第一均值距离和所述第二均值距离,构建混合蛙跳算法的适应度函数;
对所述混合蛙跳算法的适应度函数进行最大值求解,得到所述多个数据集。
3.根据权利要求1或2所述的方法,其特征在于,所述至少两个预设评价指标包括准确度指标、完整度指标、及时度指标、冗余度指标和一致度指标中的至少两个。
4.根据权利要求3所述的方法,其特征在于,所述根据至少两个预设评价指标对每个数据集进行量化分析,得到每个数据集在每个评价指标下的数据占比,包括以下指标中的至少两项:
根据每个数据集中的数据量、精确度小于预设阈值数据的个数、无效数据的个数和记录冗余数据的个数,计算所述准确度指标的占比;
根据每个数据集中的数据量、无效数据的个数、记录冗余数据的个数和空数据的个数,计算所述完整度指标的占比;
根据每个数据集中的数据量、无效数据的个数、记录冗余数据的个数、空数据个数和延迟更新的数据个数,计算所述及时度指标的占比;
根据记录冗余度占比、数据冗余占比和冗余度占比之间的线性关系,得到所述冗余度指标的占比;
根据每个数据集中数据量、无效数据的个数、记录冗余数据的个数、相同数据参照一致性的异常个数、不同数据逻辑一致性的异常个数、同时检测为相同数据参照一致性异常和不同数据逻辑一致性异常个数,计算所述一致性指标的占比。
5.根据权利要求4所述的方法,其特征在于,所述根据记录冗余度占比、数据冗余占比和冗余度占比之间的线性关系,得到所述冗余度指标的占比,包括:
根据每个数据集中数据量、无效数据的个数、记录冗余数据的个数,计算记录冗余度占比;
根据每个数据集中数据量、无效数据的个数、记录冗余数据的个数、每行的相同数据个数、每列的相同数据个数,计算数据冗余占比。
6.根据权利要求4所述的方法,其特征在于,所述根据每个数据集中数据总数、数据位无效个数、记...
【专利技术属性】
技术研发人员:孟令雯,徐长宝,席禹,林呈辉,高吉普,陈浩敏,汪明媚,范强,古庭赟,
申请(专利权)人:贵州电网有限责任公司电力科学研究院,南方电网数字电网研究院有限公司,
类型:发明
国别省市:贵州;52
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。