一种基于电子病历数据驱动的妊娠期糖尿病预测方法技术

技术编号:17251623 阅读:68 留言:0更新日期:2018-02-11 10:37
本发明专利技术公开了一种基于电子病历数据驱动的妊娠期糖尿病预测方法,在智慧医疗服务中发挥日益重要的作用,本文发明专利技术了基于机器学习的妊娠期糖尿病(gestational diabetes mellitus,GDM)妊娠期糖尿病预测框架,根据采集数据的不同时间窗划分方法,构建了全域数据预测模型、分期数据预测模型和周数据预测模型三组预测框架。在识别预测问题后,通过输入与ETL数据清洗、病案编码与特征数据关联、电子病历数据预处理、二次数据处理、特征工程、机器学习、预测应用七个步骤,实现了高维度电子病历的数据挖掘。使用临床数据构建了关于确诊的标记数据集,并将其划分为用于模型训练和测试的2个子集。通过支持向量机、贝叶斯网络、决策树以及基于集成的混合模型进行预测,实现GDM模式分类。

【技术实现步骤摘要】
一种基于电子病历数据驱动的妊娠期糖尿病预测方法
本专利技术涉及糖尿病预测领域,具体而言是一种基于电子病历数据驱动的妊娠期糖尿病预测方法。
技术介绍
在疾病预测中,以妊娠期糖尿病(gestationaldiabetesmellitus,GDM)为例,根据国际糖尿病联调查,虽然越来越多的妇女接受产前检查,但仍是最常见的妊娠并发症,其定义为妊娠前糖代谢正常或有潜在糖耐量减退、妊娠期才出现或确诊的糖尿病。GDM带来的严重后果,使得医疗群体对其提前诊断和预防十分重视。妊娠期糖尿病带来的风险包括:母婴2型糖尿病、胎儿过度生长和短期内相关不良预后风险,以及后代长期肥胖等风险。GDM预测诊断和预防作为妇幼保健群体都十分关注的重要问题,使得其成为健康医疗大数据应用的一个重要领域。临床医生和孕妇都期待在更早的妊娠阶段就能够感知GDM风险,以期尽早预防和干预。随着电子病历(Electronicmedicalrecord,EMR)及相关临床数据的周期性收集和跨界数据的积累,EMR再利用和大数据分析技术为GDM提前诊断和预防提供前瞻性工具。根据传统的诊断方法如国家卫生行业标准的妊娠期糖尿病诊断指南(2011)本文档来自技高网...
一种基于电子病历数据驱动的妊娠期糖尿病预测方法

【技术保护点】
一种基于电子病历数据驱动的妊娠期糖尿病预测方法,其特征在于:按照以下方式实现;构建以下模块;(1)、输入与ETL数据清洗模块:获取EMR对应的历史建档孕妇数据,并通过抽取、转换和加载等步骤完成初步数据清洗,完成去隐私与数据质量管理;(2)、病案编码与特征数据关联模块:通过EMR系统的患者识别码ID进行时空脱敏数据关联,结合临床知识和经验筛选特征数据,生成GDM数据仓库;(3)、EMR数据预处理模块:对输入数据进行缺失值、离散化和归一化处理;(4)、二次数据处理模块:进行分类标签校准,完成纳入排除标准检查;(5)、特征工程模块:将数据划分为GDM和非GDM两类,将与疾病关联的临床数据作为条件属性...

【技术特征摘要】
1.一种基于电子病历数据驱动的妊娠期糖尿病预测方法,其特征在于:按照以下方式实现;构建以下模块;(1)、输入与ETL数据清洗模块:获取EMR对应的历史建档孕妇数据,并通过抽取、转换和加载等步骤完成初步数据清洗,完成去隐私与数据质量管理;(2)、病案编码与特征数据关联模块:通过EMR系统的患者识别码ID进行时空脱敏数据关联,结合临床知识和经验筛选特征数据,生成GDM数据仓库;(3)、EMR数据预处理模块:对输入数据进行缺失值、离散化和归一化处理;(4)、二次数据处理模块:进行分类标签校准,完成纳入排除标准检查;(5)、特征工程模块:将数据划分为GDM和非GDM两类,将与疾病关联的临床数据作为条件属性,标记类别为决策属性,进行嵌入式特征选择;(6)、机器学习模块:根据选择的输入特征,将全数据划分为训练样本和测试样本,选择时间窗和机器学习模型,进行十字交叉法训练,得到预测算法;(7)、预测应用模块:将未确诊的孕妇电子病历数据,输入步骤(6)中的机器学习模型,推理这些待诊断孕妇的GDM发生值...

【专利技术属性】
技术研发人员:邱航余海燕王利亚张岩龙
申请(专利权)人:电子科技大学成都数联易康科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1