【技术实现步骤摘要】
一种电子证照质量检测分析模型
[0001]本专利技术涉及文件检测
,具体的说是一种电子证照质量检测分析模型。
技术介绍
[0002]当前证照库的普遍存量数据大,结构化数据复杂。要对存量数据进行质量检测时,通常采取接口+关系型数据库存储的方案。这种方案的具体流程为:通过统一信息检索接口,获取证照的元数据、照面信息、附件信息;然后根据政务服务平台已发布的电子证照工程标准,采取正则校验的方法,对获取的证照元数据、照面信息、证照附件进行检验;再将检验结果整理为结构化数据,持久化到关系型数据库中,为后续电子证照工程标准治理不规范数据提供依据。
[0003]上述方案存在两个明显的缺陷:
[0004](1)现在全国各个省证照库存量数据过大,单次检测的需求量很大,采用单一接口进行检测,对接口的响应时间、并发量,有很高的要求,实现困难;
[0005](2)各个省每日的检测需求很大,存在对一个证照,进行两次甚至多次检测,这样会导致需要持久化的检测结果结构化数据的量非常大,传统关系型关系型数据库面对这种体量的数据,实 ...
【技术保护点】
【技术特征摘要】
1.一种电子证照质量检测分析模型,其特征在于,其包括数据持久化模块和业务模块两部分,其中,所述数据持久化模块存储有证照检测时所需要的必要数据以及证照检测之后的检测结果;所述业务模块存储有电子证照检测的主入口、电子证照结构化数据检测方法、检测结果统计分析方法,用于与用户交互、分发检测请求、对证照数据进行检测以及请求所述数据持久化模块存储获取的统计检测结果。2.根据权利要求1所述的一种电子证照质量检测分析模型,其特征在于,证照检测时所需要的必要数据包括证照样本数据、标准证照类型信息、定义机构信息、照面项对应的正则校验规则、检测批次信息,其中,证照样本数据来自证照库,包括证照的元数据、照面数据、以及证照附件,属于同一个样本的证照数据具有相同的证照标识;标准证照类型信息包括证照类型代码和证照类型名称;通过证照类型代码,可以关联每个证照的正则校验规则,进而实现对不同类型证照的不同标准检测;定义机构信息包括定义机构名称和定义机构的统一社会信用代码;照面项对应的正则校验规则,即根据国办发布的电子证照工程标准,对证照元数据、照面项数据、OFD版式文件中的结构化数据定义的正则校验规则,用于对证照的结构化数据进行校验;检测批次信息是针对区分不同批次检测记录的批次号,用于区分每次的检测结果。3.根据权利要求2所述的一种电子证照质量检测分析模型,其特征在于,证照样本数据、证照类型信息、定义机构信息、照面项对应的正则校验规则、检测批次信息会根据检测批次、检测证照国家规范的变化而变化。4.根据权利要求2所述的一种电子证照质量检测分析模型,其特征在于,所述数据持久化模块包括关系型数据库、包含多个ElasticSearch的集群,所述关系型数据库存储证照检测时所需要的必要数据,所述ElasticSearch存储证照检测之后的检测结果;所述ElasticSearch的索引设计包括元数据、照面数据检测结果、文件信息检测结果三部分,其中:元数据设计为一个Object,包含证照类型代码、证照定义机构、证照所属区划三类证照索引信息,类型为keyword,用于统计聚合;照面数据检测结果和文件信息检测结果的设计分别为一个Array,Array由复数个Object组成,每个Object由照面项名、照面项检测状态组成,...
【专利技术属性】
技术研发人员:王国栋,
申请(专利权)人:浪潮软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。