一种针对ICD起搏器的结构化数据提取方法技术

技术编号:13623816 阅读:51 留言:0更新日期:2016-09-01 14:51
本发明专利技术公开一种针对ICD起搏器的结构化数据提取方法,包括以下步骤:1)从ICD起搏器中导出PDF格式的报告文件;2)根据报告文件设置CRT参数抽取规则库;3)读取文件内容;4)扫描报告文件,并提取文本内容;5)调用CRT参数抽取规则库,编程抽取符合抽取规则的数据;6)将数据写入数据库;该针对ICD起搏器的结构化数据提取方法能节省人力资源。

【技术实现步骤摘要】

本专利技术涉及一种针对ICD起搏器的结构化数据提取方法
技术介绍
充血性心力衰竭是有较高死亡率的严重疾患,每年有成千上万的患者死于心力衰竭。在过去的10余年中,在患者体内植入CRT设备已经成为治疗该级别最显著的非药物治疗方法。患者植入CRT设备后,需要定期回医院进行随访,以便心血管专科医生对CRT近期的工作进行评价,并结合CRT的诊断功能,优化设备参数、调整治疗方案。CRT设备植入患者回医院进行随访时,心血管专科医生工作流程如下——通过CRT厂家提供的程控仪,读取患者体内的CRT程控数据从CRT程仪器中的患者数据导出为PDF格式的随访报告,人工查阅报告中的各项参数指标,做出医学判断。将本次导出的报告进行存档,以便患者下次随访时进行对比。目前国内外CRT厂家仅允许将程控数据导出为PDF文件,不允许导出为excel、csv、xml等文件格式。由于PDF文件是典型的非结构化数据格式,国内临床科研工作者进行心血管领域的大数据研究时,只能通过人工抄录的方式从上述PDF文件中提取各项参数指标。由于患者数量多、程控参数复杂,人工抄录劳动强度大。
技术实现思路
本专利技术要解决的技术问题是提供一种能节省人力资源的针对ICD起搏器的结构化数据提取方法。为解决上述问题,本专利技术采用如下技术方案:一种针对ICD起搏器的结构化数据提取方法,包括以下步骤:1)从ICD起搏器中导出PDF格式的报告文件;2)根据报告文件设置CRT参数抽取规则库;3)读取文件内容;4)扫描报告文件,并提取文本内容;5)调用CRT参数抽取规则库,编程抽取符合抽取规则的数据;6)将数据写入数据库。作为优选,所述CRT参数抽取规则库的每条规则均对应着报告文件中的一个指标或参数。作为优选,所述步骤3)的具体实现方式为:3.1)采用JAVA程序打开报告文件;3.2)编程读取报告文件。作为优选,所述步骤4)的具体实现方式为:4.1)逐行扫描报告文件的内容;4.2)将每行的内容提取出来。作为优选,所述步骤5)的具体实现方式为:5.1)使用JAVA程序调用CRT参数抽取规则库;5.2)在CRT参数抽取规则库找到每行内容的抽取规则;5.3)根据抽取规则将报告文件中整行匹配的数据抽取出来;作为优选,所述步骤6)的具体实现方式为:6.6)编程将抽取出来的数据进行汇总;6.6)将汇总后的数据写入数据库。作为优选,所述数据库为SQL数据库,功能强大、简单易学、使用方便。作为优选,所述编程均为JAVA编程,具有简单性、面向对象、分布式、健壮性、安全性、平台独立与可移植性、多线程、动态性等特点,功能强大和简单易用。本专利技术的有益效果为:采用计算机编程读取PDF格式的CRT程控文件中的文本内容,将文本内容抽取出来并保存到数据库,并可导出成Excel和cvs等数据格式进行统计分析,数据抽取效率和数据抽取准确率高,彻底解决了人工抄录模式难以管控质量的难题,能节省人力资源,方便医务人员工作,以便心血管专科医生对CRT近期的工作进行评价,以便患者下次随访时进行对比。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为实施例2中的步骤5)的数据抽取流程图。具体实施方式实施例1一种针对ICD起搏器的结构化数据提取方法,包括以下步骤:1)从ICD起搏器中导出PDF格式的报告文件;2)根据报告文件设置CRT参数抽取规则库;3)读取文件内容;4)扫描报告文件,并提取文本内容;5)调用CRT参数抽取规则库,编程抽取符合抽取规则的数据,如图1所示;6)将数据写入数据库。本实施例的有益效果为:采用计算机编程读取PDF格式的CRT程控文件中的文本内容,将文本内容抽取出来并保存到数据库,并可导出成Excel和cvs等数据格式进行统计分析,数据抽取效率和数据抽取准确率高,彻底解决了人工抄录模式难以管控质量的难题,能节省人力资源,方便医务人员工作,以便心血管专科医生对CRT近期的工作进行评价,以便患者下次随访时进行对比。实施例2一种针对ICD起搏器的结构化数据提取方法,包括以下步骤:1)从ICD起搏器中导出PDF格式的报告文件;2)根据报告文件设置CRT参数抽取规则库;3)采用JAVA编程打开报告文件,JAVA编程读取报告文件;4)逐行扫描报告文件的内容,将每行的内容提取出来;5)使用JAVA编程调用CRT参数抽取规则库,在CRT参数抽取规则库中找到每行内容的抽取规则;根据抽取规则将报告文件中整行匹配的数据抽取出来,如图1所示;6)使用JAVA编程将抽取出来的数据进行汇总;将汇总后的数据写入SQL数据库。所述CRT参数抽取规则库的每条规则均对应着报告文件中的一个指标或参数,如设置了规则“体重 =${体重本文档来自技高网...

【技术保护点】
一种针对ICD起搏器的结构化数据提取方法,其特征在于:包括以下步骤:。

【技术特征摘要】
1.一种针对ICD起搏器的结构化数据提取方法,其特征在于:包括以下步骤:。2.1)从ICD起搏器中导出PDF格式的报告文件;2)根据报告文件设置CRT参数抽取规则库;3)读取文件内容;4)扫描报告文件,并提取文本内容;5)调用CRT参数抽取规则库,编程抽取符合抽取规则的数据;6)将数据写入数据库。3.根据权利要求1所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述CRT参数抽取规则库的每条规则均对应着报告文件中的一个指标或参数。4.根据权利要求2所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述步骤3)的具体实现方式为:3.1)编程打开报告文件;3.2)读取报告文件。5.根据权利要求3所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述步骤4)的具体实现方式为:...

【专利技术属性】
技术研发人员:陈样新毛涌泉罗超
申请(专利权)人:广州市皓轩软件科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1