一种数据质量检测方法及系统技术方案

技术编号:40802446 阅读:25 留言:0更新日期:2024-03-28 19:27
本发明专利技术公开了一种数据质量检测方法及系统,涉及数据质量检测技术领域。包括:获取数据源内至少一条待检测数据,将待检测数据拆解成数据字符的状态;构建筛选规则,并让同类字符信息的数据字符归纳一起;构建内部搭载有不同系统的数据分析模型。本发明专利技术相较于传统数据质量检测方法通过将待检测数据拆解成数据字符的状态,能够更精细地检测数据质量问题,其次,通过构建筛选规则和数据分析模型,能够更准确地提取数据字符内的信息,并得到多个数据字符项目,再次,通过将历史数据字符指标和数据字符项目进行比对,能够得出更准确的项目差值评分,最后,通过构建判别规则和设定判别阈值,能够更准确地判断数据质量是否达标。

【技术实现步骤摘要】

本专利技术涉及数据质量检测,具体为一种数据质量检测方法及系统


技术介绍

1、在对数据进行分析和管理的过程中,异常数据的出现会直接导致分析结果发生显著的变化,造成得到的结果超出预期,从而使管理者对整个项目过程的推断、控制和预测不准确,出现错误的判断将给整个项目带来巨大的风险,因此需要对数据进行质量检测。

2、经检索,授权公告号“cn112395280b”的中国专利技术专利,公开了“一种数据质量检测方法及其系统”,该申请根据原有整合历史数据建立数据模型,同时对新样本数据进行预测识别获得数据质量波动情况,从而能够事先采取调整措施以及针对性地进行数据质量管理。

3、此外申请公布号“cn109933581a”的中国专利技术专利,公开了“一种数据质量检测方法及系统”,该申请通过将数据等分存储到多台服务器磁盘和内存,采用分布式文件存储,让多台计算终端对分布式内存上的数据同时进行计算,实现分布式内存并行计算,然后将对多台计算终端上的运算结果进行汇总,即可完成质量检测。

4、然而上述两个专利在实际使用时,存在以下问题

5、本文档来自技高网...

【技术保护点】

1.一种数据质量检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种数据质量检测方法,其特征在于:根据项目差值评分和预设的阈值进行比较;

3.根据权利要求2所述的一种数据质量检测方法,其特征在于:根据“达标”的数据字符项目数量,进一步判断数据的质量等级;

4.根据权利要求3所述的一种数据质量检测方法,其特征在于:所述影响指标的构建标准包括:

5.根据权利要求4所述的一种数据质量检测方法,其特征在于:数据字符的项目差值评分和预设的阈值进行比较,得到差值基于影响指标的构建标准,重新构建,构建的数值为等于原先数值乘以权重数值再加上原...

【技术特征摘要】

1.一种数据质量检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种数据质量检测方法,其特征在于:根据项目差值评分和预设的阈值进行比较;

3.根据权利要求2所述的一种数据质量检测方法,其特征在于:根据“达标”的数据字符项目数量,进一步判断数据的质量等级;

4.根据权利要求3所述的一种数据质量检测方法,其特征在于:所述影响指标的构建标准包括:

5.根据权利要求4所述的...

【专利技术属性】
技术研发人员:王斌蒋博一潘黎
申请(专利权)人:成都数据集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1