一种医疗临床数据抓取预处理方法技术

技术编号:18352808 阅读:43 留言:0更新日期:2018-07-02 03:44
本发明专利技术公开了一种医疗临床数据抓取预处理方法,所述方法针对医疗相关信息系统中抓取的通用格式的医学临床数据使用相关通用接口进行接收,并进行数据的格式化、规范化、数据排重、字段拆分、字段合并等数据处理,然后通过通用格式装载至数据中心。本发明专利技术对于采集的数据可以通过预处理流程自由组合,可实现逻辑处理,灵活性高,预处理流程可以写入JS\C#\VB等代码,实现各种复杂和特殊问题。

【技术实现步骤摘要】
一种医疗临床数据抓取预处理方法
本专利技术涉及互联网
,特别涉及医疗临床数据抓取过程中对数据的预处理方法。
技术介绍
随着我国医院数字化、信息化建设的发展,医院信息管理系统(HIS)、检验信息系统(LIS)、影像系统(PACS)、体检管理系统(PEIS)、电子病历(EMR)等各种医疗子系统已被医院所采用。以往医院需要对各系统的数据进行关联并在院内共享,以方便在各个科室提取并分析数据。在现有的互联网时代,如能够将数据正确地提取、重构并利用互联网传输,将极大地提高医疗资源的灵活配置,使远程会诊、远程医疗成为一种常见的、低成本的、便捷的就诊手段。在远程会诊、远程医疗系统的使用过程中,需要发起方将病案相关资料如病人信息、病情描述、检查信息等通过Internet发送至受邀方进行诊断,其资料可能是文字、图片、音频、视频等。等待受邀方诊断完成后再将诊断结果、相关医嘱及报告返回给发起方,以完成一次诊断。而本专利技术用于解决发起方资料采集及发送的问题。现有技术中,通常采取下述方式实现资料的采集:第一,在远程会诊、远程医疗系统中提供资料上传的接口,例如支持文件的上传、文字或图片的扫描、摄像头的拍照等。同时部分系统支持实时的视频语音聊天,以支持问诊功能。采用该方式的优点在于:该方式无需介入医院自生的子系统,开发实施都较为简便。第二,在远程会诊、远程医疗系统开发的过程中与各个医院的子系统做接口,进行数据的采集,并转换为自身可以识别的数据在远程会诊的过程中提供给受邀方查阅。采用该方式的优点在于:该方式可以整合医院所有子系统的数据,并且数据的准确性及完成性可以得到有效的保证。第三,开发专有的远程会诊系统,使用特有的设备来支持该系统的运行,一般仅用医技相关科室。如远程病理系统,使用全自动数字切片扫描系统用以支持受邀方远程调整设备,进行标本检查,并出相关报告。采用该方式的优点在于:该方式可以让受邀方一定程度上控制检查的过程,以保证检查数据的有效性,提高诊断的正确性。现有技术至少存在以下问题:资料传输过来的数据存在很多重复的数据,无用的数据,错误的数据,导致数据的不完整性,无法具体完成数据的结构化和清晰化,使得数据展示和分析难度很大。
技术实现思路
为了解决现有技术的问题,本专利技术提供了一种医疗临床数据抓取预处理方法,所述技术方案如下:本专利技术采用微软WindowsWorkflowFoundation对数据进行预处理,通过流程的逻辑处理,与数据中心的数据结合,对数据进行修改,删除,增加,排重,重构等一系列预处理。针对医疗相关信息系统中,包括医院信息管理系统(HIS)、检验信息系统(LIS)、影像系统(PACS)、体检管理系统(PEIS)、电子病历(EMR)等各种医疗子系统抓取的通用格式的医学临床数据使用相关通用接口进行接收,并进行数据的格式化、规范化、数据排重、字段拆分、字段合并等数据处理,然后通过通用格式装载至数据中心。所述通用格式可包含但不局限于XML、Json、CSV等常用文本数据交换格式,对于其他二进制数据采用Base64编码进行传输。所述通用接口可包含但不局限于WebService、WCF、FTP等常用上层数据或文件传输通道。所述数据处理使用微软WindowsWorkflowFoundation实现,WindowsWorkflowFoundation支持自定义Activity,通过使用VsaEngine、CodeDom扩展Activity使其支持JScript、C#、VB等代码扩展,同时自定义Activity以支持常用的数据转换。针对C/S结构医疗相关信息系统软件界面中抓取的医学临床数据进行整合提交;针对C/S结构医疗相关信息系统软件界面中抓取的医学临床数据在数据中心中,通过workflow让数据关联和自定义字段进行排重判定,更新和重新组合数据,并整合数据提交到数据中心。抓取数据通过调用webservice提交到workflow数据流程入库工具,进行逻辑处理,修正数据,与数据中心中数据进行字段内容匹配、字段内容组合匹配、时间匹配、自定义字段关联匹配,判定重复并定位,更新数据中心相关记录。本专利技术提供的技术方案带来的有益效果是:对于采集的数据可以通过预处理流程自由组合,可实现逻辑处理,灵活性高,预处理流程可以写入JS\C#\VB等代码,实现各种复杂和特殊问题。对于常见数据转换可以使用自定义Activity对现有流程进行扩展,以实现更多、更简便的数据转换功能。附图说明图1数据抓取预处理流程示意图。具体实施方式本专利技术具体实施方式在于:1、数据用JSON\XML格式通过调用WebService\FTP传送到服务端;2、使用配置工具配置好相应的WindowsWorkflowFoundation数据预处理流程,以XML形式存储于流程服务器;3、数据转换服务获取并解析数据。4、数据转换服务根据数据标识使用微软WindowsWorkflowFoundation流程引擎转载对应的预处理流程对数据进行预处理。5、数据转换服务根据数据标识使用微软WindowsWorkflowFoundation流程引擎转载对应的预处理流程对数据进行逻辑处理,判定数据是否新增,更新,或者丢弃。6、重新处理后的数据导入至数据中心。其流程引擎支持如下处理方式:1.预处理流程既可访问数据本身也可访问元数据信息。2.预处理流程可访问指定的数据库,支持新增、修改、删除的功能。3.预处理流程支持异常处理。4.预处理流程支持分支处理。5.预处理流程支持事务处理。6.预处理流程支持延迟处理。7.同一类数据使用同一流程进行处理。数据抓取预处理流程1.采集数据客户端配置处理该数据的预处理流程标识,定义数据元数据。2.根据采集到数据格式及业务功能,定义数据处理的方案。3.根据数据处理的方案配置数据处理流程。4.使用数据配置工具调试数据处理流程,无误后提交至流程服务器。5.采集数据客户端配置流程服务器地址。6.流程服务器接收采集数据客户端提交的数据,并解析数据。7.流程服务器通过数据中包含的预处理流程标识装载预处理流程。8.流程服务器使用流程引擎执行预处理流程,完成数据预处理。本文档来自技高网
...
一种医疗临床数据抓取预处理方法

【技术保护点】
1.一种医疗临床数据抓取预处理方法,其特征在于:针对医疗相关信息系统中抓取的通用格式的医学临床数据使用相关通用接口进行接收,并进行数据的格式化、规范化、数据排重、字段拆分、字段合并等数据处理,然后通过通用格式装载至数据中心。

【技术特征摘要】
1.一种医疗临床数据抓取预处理方法,其特征在于:针对医疗相关信息系统中抓取的通用格式的医学临床数据使用相关通用接口进行接收,并进行数据的格式化、规范化、数据排重、字段拆分、字段合并等数据处理,然后通过通用格式装载至数据中心。2.如权利要求1所述医疗临床数据抓取预处理方法,其特征在于:所述通用格式可包含但不局限于XML、Json、CSV等常用文本数据交换格式,对于其他二进制数据采用Base64编码进行传输,所述通用接口可包含但不局限于WebService、WCF、FTP等常用上层数据或文件传输通道。3.如权利要求1所述医疗临床数据抓取预处理方法,其特征在于:所述数据处理使用微软WindowsWorkflowFoundation实现,WindowsWorkflowFoundation支持自定义Activity,通过使用Vs...

【专利技术属性】
技术研发人员:梁威廖上平
申请(专利权)人:长沙博为软件技术股份有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1