医联多病种影像特征库的构建方法技术

技术编号:11061798 阅读:92 留言:0更新日期:2015-02-19 08:51
本发明专利技术提供了多病种影像特征库的构建方法。所述的基于区域医疗大数据的多病种影像特征库的构建方法包括:步骤1:问题确定步骤;步骤2:数据收集步骤;步骤3:数据抽取步骤:步骤3.1:制定规则步骤:根据目标病种的影像及影像学报告中对应的表现描述关键字,参考目标应用病种的病理诊断的名称,形成抽取数据的具体规则;步骤3.2:数据筛选过滤步骤:使用了以上制定的抽取数据的具体规则对经过预处理的初步数据集中的数据进行过滤,形成样本数据库;步骤4:将样本数据库中的数据录入特征库,经过验证后录入基于区域医疗大数据的多病种影像特征库。本发明专利技术可实现对影像数据中心平台所存储数据进行数据的抽取分析,获取有效的数据。

【技术实现步骤摘要】

本专利技术涉及一种大数据挖掘技术的应用,具体涉及一种医学影像信息的分析、挖掘与应用。
技术介绍
目前我国三级医院大多建有PACS系统,实现了影像数据的院内的统一存储和调用,在北京、上海、江苏等地还建成了多个区域影像共享中心,实现了区域内的影像共享和远程诊断。影像信息学的研究也逐渐转向了大数据应用。无论是医疗影像设备的发展带来的原始影像数据量的暴涨,还是医院内或是区域医疗联合体的大量建成,造就了许多拥有海量影像大数据的平台。 上海申康医院发展中心管理的覆盖全市34家三级医院的所有诊疗数据的“医联工程”项目,目前已经完成27家(4家分院)三级医院PACS系统联网工作,形成了日均约150GB的区域影像数据中心。该影像数据平台收集了大量的病例,医联影像中心现存的影像检查数据目前已达到1900多万人次。 医联平台中存在的海量数据一直以来都被认为有很高的价值,这些数据中包括了各类的诊疗数据,其中的影像类数据无疑极为庞大。如何能透过数据的表象从这些海量的数据中找到隐藏在数据背后的如数据之间的关系、数据特征以及数据发展趋势预测等信息?又如何能从中整理出对疾病的诊断有价值乃至对病人生存有价值的信息,供给医疗教育、辅助决策和医学科研等方面使用,从而提高医疗质量和服务品质?这些需求迫使我们引入大数据分析手段及一些有效数据建模的工具,来解决这些区域医疗建设中存在的问题。 在数字化系统较为普及的美国和日、韩等国,数字化软读片训练已经成为医学生的必修课程,因此基于PACS系统的影像特征资料库,就成为稳定和大容量、高速的教学平台。通过实践证明,利用影像特征库可以节省75%的影像医学教学准备时间,提高临床学习效率40%左右。与传统型医院相比,采用影像特征库的医疗机构影像专业住院医师培训周期缩短3-6个月,临床学科住院医师影像医学考核分值高7-16%。影像特征资料库能为临床不同层次教学提供有力后盾,使得临床教学自主化的实现变成可能。
技术实现思路
本专利技术的目的在于对医联工程影像数据平台存储的海量数据进行分析后,从中挖掘出符合疾病临床诊断、有较强特征性的病例建立区域医疗多病种的影像特征库,对院内医生进行影像诊断和教学学习起到重要的参考和支持作用,为院内专家的科研工作提供数据参考。 为了达到上述目的,本专利技术提供了一种基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,具体步骤包括: 步骤1:问题确定步骤: 分析目标应用病种,定义目标数据,所述的目标数据包括影像以及与之对应的影像学报告; 步骤2:数据收集步骤: 步骤2.1:数据选取步骤: 将影像原始数据库中的影像数据、非影像数据库中与影像匹配的报告表和电子病历中其他诊断结果收集形成初步数据集; 步骤2.2:数据预处理步骤: 消除初步数据集中的缺失数据和重复记录; 步骤3:数据抽取(筛选)步骤: 步骤3.1:制定规则步骤:根据目标病种的影像及影像学报告中对应的表现描述关键字,参考目标应用病种的病理诊断的名称,形成抽取数据的具体规则; 步骤3.2:数据筛选过滤步骤:使用了以上制定的抽取数据的具体规则对经过预处理的初步数据集中的数据进行过滤,形成样本数据库; 步骤4:将样本数据库中的数据录入特征库,经过验证后录入基于区域医疗大数据的多病种影像特征库。 优选地,所述的步骤4中,在录入特征库之前,先对样本数据库中的数据进行评估规则反馈步骤,所述的评估规则反馈步骤包括:从样本数据库中的数据中收集评估数据,通过从样本数据库中每病种随机导出多个数据形成临时数据表,对该表数据进行逐条检查,检查方法为针对临时表中的Yxzd、Yxbx, Jcbw字段是否符合抽取数据的具体规则,将符合抽取数据的具体规则的录入特征库,将不符合的数据抽出。 优选地,所述的步骤4中的验证步骤为在特征库系统上使用搜索模块验证是否有与搜索病种不相符的数据,将通过验证的数据录入基于区域医疗大数据的多病种影像特征库。 优选地,所述的步骤4还包括将没有通过验证的数据抽出并查看具体的数据字段,将这些字段汇总并与步骤3.1中确定的抽取数据的具体规则进行比对,并用于校正步骤3.1中的抽取数据的具体规则。 优选地,所述的步骤2中的影像数据包括X光、CT、MR1、DSA、ECT、PET、SPECT,PET-CT、超声和内窥镜影像数据。 优选地,所述的步骤I中的目标应用病种包括结直肠癌、胃癌、急性心肌梗塞、主动脉夹层、脑卒中(含脑梗塞、脑出血)、骨肿瘤、肺癌、乳腺癌和冠心病。 与现有技术相比,本专利技术的有益效果是: 1、本专利技术可实现对影像数据中心平台所存储数据进行数据的抽取分析,获取有效的数据(符合疾病临床诊断、有较强特征性的病例数据)将展示给医联联网医院影像及相关科室医生,供其参考、学习、科研使用。 2、本专利技术所述的,基于医联数据平台的影像样本能结合如患者体征、出院诊断、病理诊断等数据与影像描述内容进行大数据量挖掘分析,找出其中的规律,对于辅助医生对类似疾病的影像诊断有很大作用。 3、本专利技术所述的通过具有典型代表意义的样本影像,供医联联网医院影像及相关科室医生进行影像诊断参考、学习使用,与卫生部医学影像专业住院医师培训基本要求结合,起到教学意义不同于一般基于医院内PACS的医学影像学教学软件,具有样本资料基数更为庞大,带教人群更为广泛等的优势。 4、本专利技术所述的影像特征库系统可应用于科研。通过选定多病种影像特征库这种具有典型代表作用的业务场景应用进行分析,在病种影像特征库的基础上实现医学影像数据的分析利用,也能助力科研工作。 【附图说明】 图1为本专利技术实施例的一种影像特征库的整体工作流程图。 图2为本专利技术实施例的一种多病种样本影像特征资料库数据抽取规则图。 【具体实施方式】 下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。 实施例1 如图1所示,基于区域医疗大数据的多病种影像特征库的构建方法,其步骤为: 步骤1、问题确定步骤; 分析目标应用病种,所述的目标应用病种包括结直肠癌、胃癌、急性心肌梗塞、主动脉夹层、脑卒中(含脑梗塞、脑出血)、骨肿瘤、肺癌、乳腺癌和冠心病。定义目标数据,所述的目标数据包括影像以及与之对应的影像学报告。 步骤2:数据收集步骤: 步骤2.1:数据选取步骤: 参照大数据技术架构,根据由问题确定阶段中得到的用户需求和专家的建议,从医联平台中将影像原始数据库“DIC0MDB”中的影像数据、非影像数据库中与影像匹配的报告表和电子病历中其他诊断结果收集形成初步数据集;所述的影像数据包括X光、CT、MR1、DSA、ECT、PET、SPECT、PET-CT、超声和内窥镜影像数据。 步骤2.2:数据预处理步骤: 消除初步数据集中的缺失数据和重复记录;通过数据分析方法,如SQL语句:处理初步数据集没有影像的校验语句、处理电子病历接口数据中的空项数据语句,从初步数据集中找出真正有用的属性以减少数据挖掘时要考虑的属性或变量个数。 步骤3:数本文档来自技高网
...

【技术保护点】
一种基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,具体步骤包括:步骤1:问题确定步骤:分析目标应用病种,定义目标数据,所述的目标数据包括影像以及与之对应的影像学报告;步骤2:数据收集步骤:步骤2.1:数据选取步骤:将影像原始数据库中的影像数据、非影像数据库中与影像匹配的报告表和电子病历中其他诊断结果收集形成初步数据集;步骤2.2:数据预处理步骤:消除初步数据集中的缺失数据和重复记录;步骤3:数据抽取步骤:步骤3.1:制定规则步骤:根据目标病种的影像及影像学报告中对应的表现描述关键字,参考目标应用病种的病理诊断的名称,形成抽取数据的具体规则;步骤3.2:数据筛选过滤步骤:使用了以上制定的抽取数据的具体规则对经过预处理的初步数据集中的数据进行过滤,形成样本数据库;步骤4:将样本数据库中的数据录入特征库,经过验证后录入基于区域医疗大数据的多病种影像特征库。

【技术特征摘要】
1.一种基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,具体步骤包括: 步骤1:问题确定步骤: 分析目标应用病种,定义目标数据,所述的目标数据包括影像以及与之对应的影像学?艮告; 步骤2:数据收集步骤: 步骤2.1:数据选取步骤: 将影像原始数据库中的影像数据、非影像数据库中与影像匹配的报告表和电子病历中其他诊断结果收集形成初步数据集; 步骤2.2:数据预处理步骤: 消除初步数据集中的缺失数据和重复记录; 步骤3:数据抽取步骤: 步骤3.1:制定规则步骤:根据目标病种的影像及影像学报告中对应的表现描述关键字,参考目标应用病种的病理诊断的名称,形成抽取数据的具体规则; 步骤3.2:数据筛选过滤步骤:使用了以上制定的抽取数据的具体规则对经过预处理的初步数据集中的数据进行过滤,形成样本数据库; 步骤4:将样本数据库中的数据录入特征库,经过验证后录入基于区域医疗大数据的多病种影像特征库。2.如权利要求1所述的基于区域医疗大数据的多病种影像特征库的构建方法,其特征在于,所述的步骤4中,在录入特征库之前,先对样本数据库中的数据进行评估规则反馈步骤,所述的评估规则反馈步骤包括:从样本数据库中的数据中收集评估数据,通过从样本数据库中每病种随...

【专利技术属性】
技术研发人员:何萍张美峰李莹
申请(专利权)人:上海申康医院发展中心上海岱嘉医学信息系统有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1