一种医疗大数据采集的方法及系统技术方案

技术编号:38888117 阅读:9 留言:0更新日期:2023-09-22 14:14
本发明专利技术及医疗数据采集技术领域,具体公开了一种医疗大数据采集的方法及系统,所述采集方法包括如下步骤:S1、确定待采集数据网站的具体网址;S2、通过网页爬虫模块对于网址中的数据进行采集;S3、将步骤S2中所采集的数据利用网页解析模块进行采解析处理;S4、将步骤S3中解析后的数据利用过滤模块进行过滤处理;S5、将步骤S4中过滤后的数据进行存储在数据库中;所述采集系统中提供不同的功能模块来满足采集方法使用,完成整个医疗数据的采集;本发明专利技术所提供的采集方法以及系统,通过利用爬虫技术对于网页信息进行采集,简化了工作人员数据录入的工作,有效提高了工作人员录入数据的工作效率;相较于传统数据采集方法,耗时更短、效率更高。率更高。率更高。

【技术实现步骤摘要】
一种医疗大数据采集的方法及系统


[0001]本专利技术及医疗数据采集
,具体为一种医疗大数据采集的方法及系统。

技术介绍

[0002]随着社会和信息技术的快速发展,现代化的医院管理越来越离不开计算机、网络、数据库等信息技术的支持。
[0003]每个地区以及每个时间内,医院中都会有很多的就诊患者,他们进行着各项体检,医生针对性的开具各种不同剂量的药品,记录患者不同时间段的身体状况,这些临床就诊参数在现实中并未得到统一的挖掘、收集、存储和利用,未形成一个统一的系统针对性的进行数据的利用;现有大多数据填报平台均由医生或医助手动填写。这种方式即不能保证上报数据的正确性,也给医院增加了经费支出和额外工作负担。

技术实现思路

[0004]本专利技术的目的在于提供一种医疗大数据采集的方法及系统,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种医疗大数据采集的方法,包括如下步骤:S1、确定待采集数据网站的具体网址;S2、通过网页爬虫模块对于网址中的数据进行采集;S3、将步骤S2中所采集的数据利用网页解析模块进行采解析处理;S4、将步骤S3中解析后的数据利用过滤模块进行过滤处理;S5、将步骤S4中过滤后的数据进行存储在数据库中。
[0006]优选的,所述步骤S1中,提供医疗数据的网站为医院的内网,所采集的数据具体包括但不限于临床医疗数据、电子病历数据、医药存储数据。
[0007]优选的,所述步骤S2中,网页爬虫模块设置为定期对数据进行采集或者手动启动进行采集工作。
[0008]优选的,所述步骤S3中,网页解析模块对采集到的数据判断数据来源特征以及数据种类,并解析其数据格式、存储格式、数据字段、更新机制、信息维度、数据质量,以准确读取数据内容。
[0009]优选的,所述步骤S4中,过滤模块将数据中去除无关医疗的以及重复的数据,形成清洁的存储数据。
[0010]所述步骤S5中,数据库对于数据按照步骤S中的数据来源进行分类存储,且数据库设置有云端同步单元,数据在云端服务器中进行同步。
[0011]优选的,本专利技术还提供了一种医疗大数据采集系统,包括用于调整系统工作的数据处理中心、用于与医院内网建立连接的web模块、用于实现网页页面信息获取的网页爬虫模块、用于对获取的信息进行解析的网页解析模块、用于对数据进行过滤处理的过滤模块
以及用于数据存储的数据库,所述数据处理中心与web模块、网页爬虫模块、网页解析模块、过滤模块、数据库电性连接。
[0012]优选的,所述数据库设置有云端同步单元,在数据库发生数据变化后,对于数据变化内容在云端服务器中进行同步。
[0013]优选的,所述数据处理中心连接有移动终端,所述移动终端为台式计算机、笔记本电脑、平板电脑、智能手机中的任意一种,所述移动终端与数据处理中心通过网络通信进行连接。
[0014]与现有技术相比,本专利技术的有益效果是:本专利技术所提供的采集方法以及系统,通过利用爬虫技术对于网页信息进行采集,简化了工作人员数据录入的工作,有效提高了工作人员录入数据的工作效率;相较于传统数据采集方法,耗时更短、效率更高。
附图说明
[0015]图1为本专利技术的流程示意图;图2为本专利技术的结构示意图;图中标号:1、数据处理中心;2、web模块;3、网页爬虫模块;4、网页解析模块;5、过滤模块;6、数据库;7、云端同步单元。
具体实施方式
[0016]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0017]请参阅图1

2,本专利技术提供一种技术方案:一种医疗大数据采集的方法,包括如下步骤:S1、确定待采集数据网站的具体网址;S2、通过网页爬虫模块3对于网址中的数据进行采集;S3、将步骤S2中所采集的数据利用网页解析模块4进行采解析处理;S4、将步骤S3中解析后的数据利用过滤模块5进行过滤处理;S5、将步骤S4中过滤后的数据进行存储在数据库6中。
[0018]进一步的,所述步骤S1中,提供医疗数据的网站为医院的内网,所采集的数据具体包括但不限于临床医疗数据、电子病历数据、医药存储数据。
[0019]进一步的,所述步骤S2中,网页爬虫模块3设置为定期对数据进行采集或者手动启动进行采集工作。
[0020]进一步的,所述步骤S3中,网页解析模块4对采集到的数据判断数据来源特征以及数据种类,并解析其数据格式、存储格式、数据字段、更新机制、信息维度、数据质量,以准确读取数据内容。
[0021]进一步的,所述步骤S4中,过滤模块5将数据中去除无关医疗的以及重复的数据,形成清洁的存储数据。
[0022]进一步的,所述步骤S5中,数据库6对于数据按照步骤S1中的数据来源进行分类存
储,且数据库6设置有云端同步单元7,数据在云端服务器中进行同步。
[0023]进一步的,本专利技术还提供了一种医疗大数据采集系统,包括用于调整系统工作的数据处理中心1、用于与医院内网建立连接的web模块2、用于实现网页页面信息获取的网页爬虫模块3、用于对获取的信息进行解析的网页解析模块4、用于对数据进行过滤处理的过滤模块5以及用于数据存储的数据库6,所述数据处理中心1与web模块2、网页爬虫模块3、网页解析模块4、过滤模块5、数据库6电性连接。
[0024]进一步的,所述数据库6设置有云端同步单元7,在数据库6发生数据变化后,对于数据变化内容在云端服务器中进行同步。
[0025]进一步的,所述数据处理中心1连接有移动终端,所述移动终端为台式计算机、笔记本电脑、平板电脑、智能手机中的任意一种,所述移动终端与数据处理中心1通过网络通信进行连接。
[0026]工作原理:实际使用过程中,数据处理中心1通过web模块2与医院的内网建立数据连接,从而便于网页爬虫模块3对于网址中的数据进行采集,获取临床医疗数据、电子病历数据、医药存储数据。网页解析模块4对采集到的数据判断数据来源特征以及数据种类,并解析其数据格式、存储格式、数据字段、更新机制、信息维度、数据质量,以准确读取数据内容,之后再通过过滤模块5将数据中去除无关医疗的以及重复的数据,形成清洁的存储数据,最终存储数据在数据库6中进行存储,且存储按照步骤S1中的数据来源进行分类;数据库6借用云端同步单元7来实现数据在云端服务器的同步,保证数据的安全性,同时方便远程调阅存储的数据。
[0027]数据处理中心1连接有移动终端,移动终端通过向数据处理中心1发送指令来实现调控系统的工作;可以主动通过移动终端来使网页爬虫模块3启动进行采集工作,同时网页爬虫模块3也定期对数据进行采集。移动终端在实际应用中,可以是任何与系统建立连接的智能设备,也可以设置多个,以供不同的使用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗大数据采集的方法,其特征在于:包括如下步骤:S1、确定待采集数据网站的具体网址;S2、通过网页爬虫模块(3)对于网址中的数据进行采集;S3、将步骤S2中所采集的数据利用网页解析模块(4)进行采解析处理;S4、将步骤S3中解析后的数据利用过滤模块(5)进行过滤处理;S5、将步骤S4中过滤后的数据进行存储在数据库(6)中。2.根据权利要求1所述的一种医疗大数据采集的方法,其特征在于:所述步骤S1中,提供医疗数据的网站为医院的内网,所采集的数据具体包括但不限于临床医疗数据、电子病历数据、医药存储数据。3.根据权利要求1所述的一种医疗大数据采集的方法,其特征在于:所述步骤S2中,网页爬虫模块(3)设置为定期对数据进行采集或者手动启动进行采集工作。4.根据权利要求1所述的一种医疗大数据采集的方法,其特征在于:所述步骤S3中,网页解析模块(4)对采集到的数据判断数据来源特征以及数据种类,并解析其数据格式、存储格式、数据字段、更新机制、信息维度、数据质量,以准确读取数据内容。5.根据权利要求1所述的一种医疗大数据采集的方法,其特征在于:所述步骤S4中,过滤模块(5)将数据中去除无关医疗的以及重复的数据,形成清洁的...

【专利技术属性】
技术研发人员:杨晨王猛丁海波
申请(专利权)人:南京贝登医疗股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1