一种实验数据治理和管理的方法技术

技术编号：25552258 阅读：45 留言：0更新日期：2020-09-08 18:52

本发明专利技术提供一种实验数据治理和管理的方法，属于数据处理技术领域，本发明专利技术通过网络爬虫技术将试验登记公示信息采集后，按照其业务逻辑进行数据拆分，然后将它们重新组合为结构化的数据后存储到到关系型数据库中；同时具有数据操作权限的用户结合其专业知识对试验数据进行初步拆解结构化；通过结构化和标准化对试验数据进行治理后，为患者招募提供高效数据对接，充分发挥数据价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种实验数据治理和管理的方法
本专利技术涉及数据处理技术，尤其涉及一种实验数据治理和管理的方法。
技术介绍
任何应用系统都离不开对数据的处理，数据也是驱动业务创新以及向智能化发展最核心的东西。这也是为何目前大多数企业都在构建数据中台的原因，数据处理的技术已经是核心竞争力。在一个完备的技术架构中，通常也会由应用系统以及数据系统构成。应用系统负责处理业务逻辑，而数据系统负责处理数据。数据结构化是数据库系统与文件系统的根本区别。在文件系统中，独立文件内部的数据一般是有结构的，但文件之间不存在联系，因此从数据的整体来说是没有结构的。数据库系统虽然也常常分成许多单独的数据文件，并且文件内部也具有完整的数据结构，但是它更注意同一数据库中各数据文件之间的相互联系。传统模式存在病历不足和入排标准解读慢匹配效率低等主要问题，基于上述背景，需要分别解决院内病历和试验入排标准的问题；但是目前的数据采集和处理上仍有很大问题，以至于数据不能很好的对接。
技术实现思路
为了解决以上技术问题，本专利技术提供了一种对数据保存、表格在线编辑及对入排标准数据进行结构化处理的方法，通过结构化和标准化对试验数据进行治理后，提供高效数据对接，充分发挥数据价值，解决试验入排标准面临的问题。本专利技术的技术方案是：一种实验数据治理和管理的方法，包括如下步骤：1)验数据保存；2)表格在线编辑；3)对入排标准数据进行结构化。进一步的，通过网络爬虫技术将试验登记公示信息...

【技术保护点】
1.一种实验数据治理和管理的方法，其特征在于，/n1)验数据保存；/n2)表格在线编辑；/n3)对入排标准数据进行结构化。/n

【技术特征摘要】
1.一种实验数据治理和管理的方法，其特征在于，
1)验数据保存；
2)表格在线编辑；
3)对入排标准数据进行结构化。

2.根据权利要求1所述的方法，其特征在于，
通过网络爬虫技术将试验登记公示信息采集后，按照其业务逻辑进行数据拆分，然后将它们重新组合为结构化的数据后存储到到关系型数据库中；同时具有数据操作权限的用户对数据进行初步拆解结构化。

3.根据权利要求2所述的方法，其特征在于，
通过使用网络爬虫技术，将数据采集，经过清洗后并存储到关系型数据库，然后进行数据结构化管理和维护，初次爬取对数据源全量数据进行采集，如果数据有变化，则通过逐条对比全字段是否有某些字段值的变化，如有变化则增量更新。

4.根据权利要求3所述的方法，其特征在于，
爬取方式分类两种：一种是设置周期时间进行自动化定时采集；一种是手动立即爬取。

5.根据权利要求4所述的方法，其特征在于，
在数据爬取过程中进行操作，采用正则表达式的方式，根据网页结构的规则、节点属性便可从中提取网页信...

【专利技术属性】
技术研发人员：刘昊东，刘壮，
申请(专利权)人：山东健康医疗大数据有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人