The invention discloses an automatic reporting method for environmental health data quality verification: step 1, transforming data files into data streams for batch operation of computer programs; step 2, transforming data streams into complex data objects and storing them in databases; step 3, according to relevant research needs in the field, utilizing the verification rules of various types of data to key points in data. Fields are checked, and data problems are automatically checked and recorded in real time. Step 4: Statistics and records of problems found in the data are checked and verified and fed back to the implementation subject in the form of audit reports. The method of the invention is capable of statistic large data, simplifies the complexity of data types, avoids the problem of multi-source heterogeneity of data, unifies the data use standard, improves the data quality, and greatly reduces the manual workload of verification and facilitates the research work.
【技术实现步骤摘要】
一种环境健康数据质量核查的自动化报告方法
本专利技术是一种环境健康数据质量核查的自动化报告方法,属于环境健康及计算机
,主要针对领域内存在的多类型多业务主题的大量复杂数据进行规范的自动核查处理,方便领域上对数据的管理及分析。在理论方法研究的基础上结合了包括互联网技术、数据库技术、信息安全技术在内的主流计算机领域技术,以此作为应用和研究工具实现了该方法的应用价值。
技术介绍
在我国当下的环境健康领域中,环境健康问题一直备受各界关注。环境健康大数据的研究是该领域当前的热点之一,而目前环境健康领域的数据存在着海量性、复杂性、差异性等问题,这些数据特性极大地增加了数据核查方面的人工困难。通常情况下,环境健康类数据有着各自的使用标准和范围,各个地方的数据有电子系统存储记录的形式,也有传统纸质文档备案表单形式,没有综合性统一的归纳整理。数据格式的不一致性大大降低数据可用性与数据应用的效用。如何对大量的环境与健康数据进行快速核查及有效清理,使数据规范化,便于后续应用,提高工作效率,是目前环境健康领域亟待解决的技术问题。。有鉴于此,需要自动一种化数据核查技术以解决当下数据量大、种类复杂、各地质量标准不统一的问题,从而形成了应用于环境健康领域不同类型大数据的质量核查与评估的方法。当下已有成熟的数据库技术、互联网技术和信息安全传输技术,能够良好地应用于数据管理和统计计算领域。针对上述研究方法,我们将通过Web技术进行本研究方法的实施,以达到数据的自动化质量核查评估、自动化规范管理和自动化统计产出数据质量核查报告的目的。该方法的专利技术能够解决环境和健康领域数据质量层次不 ...
【技术保护点】
1.一种环境健康数据质量核查的自动化报告方法,其特征在于:该方法具体包括如下步骤:步骤一自动化数据解析:将数据文件转化为数据流的形式,可供计算机程序批量操作;步骤二数据的归纳整理:将数据流转化为复杂数据对象,存入数据库;步骤三自动化数据校验:依照领域相关研究需求,利用各类数据的校验规则对数据中的各项关键字段进行检查,对于发现的数据问题进行自动化检查和实时记录;其中所述的数据问题包括数据重复、数据缺失、数据大小不合适或不符合经验概念的逻辑性数据错误;步骤四自动化产出核查报告:对于已发现数据中的问题经校验检查后的统计和记录并以审核报告的形式反馈给实施主体,其内容包括:数据的缺失情况,数据的重复情况,数据中存在经验性逻辑错误的聚集情况,并罗列出错误数据的详细位置。
【技术特征摘要】
1.一种环境健康数据质量核查的自动化报告方法,其特征在于:该方法具体包括如下步骤:步骤一自动化数据解析:将数据文件转化为数据流的形式,可供计算机程序批量操作;步骤二数据的归纳整理:将数据流转化为复杂数据对象,存入数据库;步骤三自动化数据校验:依照领域相关研究需求,利用各类数据的校验规则对数据中的各项关键字段进行检查,对于发现的数据...
【专利技术属性】
技术研发人员:李湉湉,班婕,王情,孙庆华,杜宗豪,
申请(专利权)人:中国疾病预防控制中心环境与健康相关产品安全所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。