一种基于自动匹配规则的数据质量和安全处理系统及方法技术方案

技术编号:45868230 阅读:15 留言:0更新日期:2025-07-19 11:23
本发明专利技术公开了一种基于自动匹配规则的数据质量和安全处理系统及方法,所述系统包括:规则动态配置模块,通过JSON结构化描述实现规则参数与前端表单的动态映射;多源数据采集模块,用于对接异构数据源;数据特征识别模块,通过特征识别技术提取数据特征,并自动匹配和校验规则;分布式计算引擎模块,基于Spark实现数据质量检查、数据安全处理任务的并行化执行;闭环反馈模块,通过历史检查结果优化规则阈值。本发明专利技术解决了传统数据质量检查中规则固化、校验效率低、异常定位困难等问题,实现了数据质量问题的实时发现、精准定位与自动化处置。

【技术实现步骤摘要】

本专利技术属于大数据治理,具体是一种基于自动匹配规则的数据质量和安全处理系统及方法


技术介绍

1、随着数据成为企业的重要资产,数据的质量和安全性对于企业的决策和运营至关重要。然而,现有数据处理流程中,数据质量检查和安全处理往往依赖于人工设定的规则和策略,这不仅效率低下,而且容易出错。同时,随着数据量的不断增加,传统的数据质量检查方法已经难以满足高效、准确的需求。

2、现有技术中存在以下缺陷:

3、规则扩展性差:传统方案需为每个规则开发独立代码,导致系统臃肿,难以快速响应业务需求变化。

4、校验效率低:单机执行引擎无法应对海量数据校验,时效性难以保障。

5、问题定位困难:缺乏数据血缘追踪能力,异常数据溯源耗时较长。

6、阈值静态化:规则阈值依赖人工经验设定,无法自适应数据分布变化。


技术实现思路

1、鉴于上述问题,提出了本专利技术以便提供克服上述问题或者至少部分地解决上述问题的一种。

2、为实现上述目的,本专利技术采用了如下技术方案:...

【技术保护点】

1.一种基于自动匹配规则的数据质量和安全处理系统,其特征在于,所述系统包括:

2.如权利要求1所述的一种基于自动匹配规则的数据质量和安全处理系统,其特征在于,规则动态配置模块包括:

3.如权利要求2所述的一种基于自动匹配规则的数据质量和安全处理系统,其特征在于,所述预定义规则模板包括空值检查、字段长度检查、两表一致性检查、身份证号脱敏和银行卡号脱敏。

4.如权利要求1所述的一种基于自动匹配规则的数据质量和安全处理系统,其特征在于,多源数据采集模块包括连接器单元,连接器单元支持JDBC、HDFS和Kafka数据源接入,用于从数据源采集待处理的数据。...

【技术特征摘要】

1.一种基于自动匹配规则的数据质量和安全处理系统,其特征在于,所述系统包括:

2.如权利要求1所述的一种基于自动匹配规则的数据质量和安全处理系统,其特征在于,规则动态配置模块包括:

3.如权利要求2所述的一种基于自动匹配规则的数据质量和安全处理系统,其特征在于,所述预定义规则模板包括空值检查、字段长度检查、两表一致性检查、身份证号脱敏和银行卡号脱敏。

4.如权利要求1所述的一种基于自动匹配规则的数据质量和安全处理系统,其特征在于,多源数据采集模块包括连接器单元,连接器单元支持jdbc、hdfs和kafka数据源接入,用于从数据源采集待处理的数据。

5.如权利要求4所述的一...

【专利技术属性】
技术研发人员:汪欢王德鑫蒋旭谭炜波孙荣利桑国彪
申请(专利权)人:北京神舟航天软件技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1