心脑血管疾病风险预测方法及系统技术方案

技术编号:15691256 阅读:184 留言:0更新日期:2017-06-24 04:18
本发明专利技术提供了一种心脑血管疾病风险预测方法及系统,该方法包括以下步骤:步骤一,心脑血管疾病预后风险预测问题定义,步骤二,采集心脑血管患者的健康医疗数据,步骤三,对数据进行预处理,包括数据集成、数据清洗以及缺失数据处理,步骤四,进行特征构造和特征选择,识别出潜在的风险因子,步骤五,将识别出的风险因子和康复结局组成输入‑输出样本集,输入到随机森林算法中进行模型训练,并对模型的预测性能进行评估。本发明专利技术临床医生输入模型方法需要的心脑血管患者的健康医疗数据,通过模型得到患者未来某个时间段的预测康复结局,能够很好的进行预后风险预测,从而实现个性化的精准康复治疗。

Cardiovascular disease risk prediction method and system

The present invention provides a method to predict the risk of cardiovascular disease and the system, the method comprises the following steps: step one, the prognosis of cardiovascular disease risk prediction problem definition, step two, health data collection, cardiovascular patients in step three, the data pretreatment, including data integration, data cleaning and missing data processing step four, the feature, structure and feature selection, and identify the risk factors, potential step five, will identify the risk factor and the outcome of rehabilitation. Input and output sample set, input to the random forest algorithm is used to train the model, and the predictive ability of the models to assess the. Health care data of cardiovascular patients need the clinician input method, forecast the rehabilitation outcome of patients with a future period of time through the model, can be a good prognostic risk prediction, in order to achieve accurate personalized rehabilitation.

【技术实现步骤摘要】
心脑血管疾病风险预测方法及系统
本专利技术涉及一种智慧医疗领域,具体地,涉及一种心脑血管疾病风险预测方法及系统。
技术介绍
心脑血管疾病泛指由于高脂血症、血液黏稠、动脉粥样硬化、高血压等所导致的心脏、大脑及全身组织发生的缺血性或出血性疾病,是心脏血管和脑血管疾病的统称。心脑血管疾病是一种严重威胁人类,特别是50岁以上中老年人健康的常见病,具有高患病率、高致残率和高死亡率的特点,即使应用目前最先进、完善的治疗手段,仍有50%以上的心脑血管疾病幸存者生活不能完全自理,全世界每年死于心脑血管疾病的人数高达1500万人,居各种死因首位。预后预测是指预测疾病的可能病程和结局。它既包括判断疾病的特定后果,也包括提供时间线索,如预测某段时间内发生某种结局的可能性。早发现、早诊断、早治疗是改善预后的前提。心脑血管疾病患者的良好预后是患者生活质量的保障,也是医患双方进行康复治疗的首要目标。精准医疗的一个目标是能对心脑血管疾病患者的预后有准确的预测,从而能针对性地对康复项目进行调整,达到康复速度快,康复效果好的目标。随着医疗信息化的发展,医院积累了大量的健康医疗数据。如何更好的利用这些数据以及医学知识,本文档来自技高网...
心脑血管疾病风险预测方法及系统

【技术保护点】
一种心脑血管疾病风险预测方法,其特征在于,其包括以下步骤:步骤一,问题定义,心脑血管疾病患者预后风险预测问题包括分析的目标人群、关心的预后结局、人群数据采集的观察窗口及预测时间窗口;步骤二,数据采集,针对目标人群,从相关信息系统收集观察期窗口内的心脑血管疾病患者的医疗健康数据及预后结局数据;步骤三,数据预处理,数据质量的好坏直接影响模型的预测效果,数据预处理针对数据集进行一系列的集成、清洗和缺失数据的处理,从而提高数据质量。采集的数据类型多种多样,其中包括选择项、日期时间、数值型、字符型以及是否型数据,不同数据类型使得数据预处理更加有挑战性,针对不同数据类型需要采取不同处理方法进行针对性数据预...

【技术特征摘要】
1.一种心脑血管疾病风险预测方法,其特征在于,其包括以下步骤:步骤一,问题定义,心脑血管疾病患者预后风险预测问题包括分析的目标人群、关心的预后结局、人群数据采集的观察窗口及预测时间窗口;步骤二,数据采集,针对目标人群,从相关信息系统收集观察期窗口内的心脑血管疾病患者的医疗健康数据及预后结局数据;步骤三,数据预处理,数据质量的好坏直接影响模型的预测效果,数据预处理针对数据集进行一系列的集成、清洗和缺失数据的处理,从而提高数据质量。采集的数据类型多种多样,其中包括选择项、日期时间、数值型、字符型以及是否型数据,不同数据类型使得数据预处理更加有挑战性,针对不同数据类型需要采取不同处理方法进行针对性数据预处理;步骤四,特征工程,基于经过清洗的病人住院记录、健康状况特征形成一系列观测向量,主要工作包括基于各种数据类型生成原始输入特征,数据类型的转换,并基于领域知识及历史数据生成新的输入特征;步骤五,模型构建与评估,在众多的机器学习算法中,随机森林是一种利用多个分类树对数据进行判别与分类的方法,随机森林算法擅长处理高维特征,同时还给出各个变量的重要性评分,评估各个变量在分类中所起的作用且易于实现并行化。利用选定的人群和输入特征及已知的康复结局,构建了随机森林预测模型。2.根据权利要求1所述的心脑血管疾病风险预测方法,其特征在于,所述步骤二中数据采集所需要采集的数据包括:康复科门诊数据、康复科治疗室数据、神内/神外门诊数据、神内/神外住院数据、康复科住院数据、脑卒中筛查门诊数据,这些数据涉及的内容涵盖有患者基本信息、病历或电子病历、检测检验、影像、诊断、处方、治疗、评估表数据。3.根据权利要求1所述的心脑血管疾病风险预测方法,其特征在于,所述步骤三具体包括以下步骤:步骤三十一,数据集成,把不同来源、格式、特点性质的数据整合到一起,从而为之后的分析和模型训练提供全面的数据,只需把不同来源的数据按照一定联系规则整合到一起,根据病人ID号把不同数据源但有同样ID号的信息连接在一起,这样所有来自不同数据源的数据就被整合到了一起;步骤三十二,数据清洗,数据清洗的任务是通过各种措施从准确性、一致性、无冗余性角度清洗原始数据以提高数据质量,方便下一步缺失数据处理的操作;步骤三十三,缺失值处理,是对数...

【专利技术属性】
技术研发人员:童晓渝章玉宇崔修涛王永明熊伟胡天龙廖光源
申请(专利权)人:中电科软件信息服务有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1