风险预测方法及系统技术方案

技术编号:17668217 阅读:38 留言:0更新日期:2018-04-11 06:43
本发明专利技术公开了一种风险预测方法及系统,该方法包括:从地区医疗信息系统中收集与心脑血管相关的基础数据;基于所述基础数据建立广义线性逻辑回归模型;根据所述广义线性逻辑回归模型预测个人心脑血管发生概率。由此可以解决问卷调查和身体检查刻意采集数据的耗时费力情况,并显著提高对心脑血管疾病的预测准确度。

Risk prediction method and system

【技术实现步骤摘要】
风险预测方法及系统
本专利技术涉及风险评估
,尤其涉及风险预测方法及系统。
技术介绍
心脑血管疾病包括冠心病(心绞痛、心肌梗塞、动脉硬化性心脏病、冠脉综合症等)和脑卒中(缺血性和出血性脑卒中、蛛网膜下腔出血等),两种病发病原因较为相似,参考国际通行作法,将其归为一类疾病。目前,心脑血管疾病已经成为我国居民死亡首因,但是疾病控制预防中心对心脑血管高风险人数的筛查仍基于传统的经验判断,学术机构对心脑血管疾病风险预测基于问卷调查和身体检查等,大规模的人群调查耗时耗力,目前业界尚无基于健康大数据的心脑血管长期风险预测模型。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种风险预测方法及系统,以解决现有心脑血管疾病预测方式中问卷调查和身体检查刻意采集数据的耗时费力的问题。为实现上述目的,本专利技术提供一种风险预测方法,该方法包括步骤:从地区医疗信息系统中收集与心脑血管相关的基础数据;基于所述基础数据建立广义线性逻辑回归模型;及根据所述广义线性逻辑回归模型预测个人心脑血管发生概率。优选地,所述基础数据包括所述地区内满足预设年龄且排除当年本身患有心脑血管疾病的人群在预设历史时间段内的个人疾病史和用药史信息。优选地,所述基于所述基础数据建立广义线性逻辑回归模型的步骤具体包括:根据心脑血管疾病的主要疾病因子构建初始模型;尝试添加其他特征作为变量并进行降维处理,以对所述初始模型进行优化;根据优化结果生成最终模型。优选地,所述初始模型以性别、年龄、住院次数、门诊次数、糖尿病、高血压、头晕头痛症状、胸闷胸痛症状、慢性阻塞性肺疾病、心律失常作为变量。优选地,所述降维处理采用主成分分析法进行降维。优选地,所述最终模型以年龄、性别、门诊就诊次数、高血压、糖尿病、头晕头痛眩晕,以及多个机构就诊次数特征、科室就诊次数特征、药物/诊疗项目使用次数特征作为变量。优选地,所述根据所述广义线性逻辑回归模型预测个人心脑血管发生概率的步骤具体包括:输入用户在预设历史时间段内对应的预测变量;采用所述广义线性逻辑回归模型根据所输入的预测变量进行评估,得到在预设未来时间段内对应的心脑血管疾病发生概率;输出评估得到的所述心脑血管疾病发生概率。本专利技术提出的风险预测方法,基于从地区医疗信息系统中收集的个人疾病史和用药史信息建立广义线性逻辑回归模型,并在初始模型的基础上进一步优化选择最佳的预测变量,从而根据某个人第一年间就诊信息预测未来两年间的心脑血管疾病发生风险。该方法可以解决问卷调查和身体检查刻意采集数据的耗时费力情况,并且采用大数据手段建模,可以显著提高对心脑血管疾病的预测准确度。为实现上述目的,本专利技术还提出一种风险预测系统,该系统包括:收集模块,用于从地区医疗信息系统中收集与心脑血管相关的基础数据;建立模块,用于基于所述基础数据建立广义线性逻辑回归模型;及预测模块,用于根据所述广义线性逻辑回归模型预测个人心脑血管发生概率。优选地,所述建立模块还用于:根据心脑血管疾病的主要疾病因子构建初始模型;尝试添加其他特征作为变量并进行降维处理,以对所述初始模型进行优化;根据优化结果生成最终模型。优选地,所述预测模块还用于:输入用户在预设历史时间段内对应的预测变量;采用所述广义线性逻辑回归模型根据所输入的预测变量进行评估,得到在预设未来时间段内对应的心脑血管疾病发生概率;输出评估得到的所述心脑血管疾病发生概率。本专利技术提出的风险预测系统,基于从地区医疗信息系统中收集的个人疾病史和用药史信息建立广义线性逻辑回归模型,并在初始模型的基础上进一步优化选择最佳的预测变量,从而根据某个人第一年间就诊信息预测未来两年间的心脑血管疾病发生风险。该系统可以解决问卷调查和身体检查刻意采集数据的耗时费力情况,并且采用大数据手段建模,可以显著提高对心脑血管疾病的预测准确度。附图说明图1为本专利技术第一实施例提出的一种风险预测方法的流程图;图2为图1中步骤S102的具体流程图;图3为图1中步骤S104的具体流程图;图4为所述风险预测方法的预测效果示意图;图5为本专利技术第二实施例提出的一种风险预测系统的模块示意图;本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。第一实施例如图1所示,本专利技术第一实施例提出一种风险预测方法,该方法包括以下步骤:S100,从地区医疗信息系统中收集与心脑血管相关的基础数据。具体地,所述基础数据包括该地区40岁以上(因为95%的患者都大于40岁)且排除当年本身患有心脑血管疾病的人群在预设历史时间段内(例如一年内)的个人疾病史和用药史信息。S102,基于所述基础数据建立广义线性逻辑回归模型。具体地,所述广义线性逻辑回归模型通过函数L将ax+b对应一个概率p,p=L(ax+b),然后根据p与1-p的大小决定因变量y的值,其中a和b是待求参数,x是自变量。逻辑回归的因变量可以是二分类的,也可以是多分类的,实际中最为常用的是二分类的逻辑回归。逻辑回归模型的适用条件包括:(1)因变量为二分类的分类变量或某事件的发生率,并且是数值型变量。但是需要注意,重复计数现象指标不适用于逻辑回归。(2)残差和因变量都要服从二项分布。二项分布对应的是分类变量,所以不是正态分布,不是用最小二乘法,而是最大似然法来解决方程估计和检验问题。(3)自变量和逻辑概率是线性关系。(4)各观测对象间相互独立。参阅图2所示,为所述步骤S102的具体流程图。该流程包括步骤:S200,根据心脑血管疾病的主要疾病因子构建初始模型。具体地,初始模型根据知识经验和相关文献选择心脑血管疾病的主要疾病因子以及患病人数较多的疾病作为潜在因子来进行构建。所述潜在因子可以包括:脑卒中;糖尿病;高血压;胸闷、胸痛等循环呼吸症状;头痛、头晕、眩晕等头部症状;肺炎;支气管炎;感冒、急性上呼吸道感染;慢性阻塞性肺病;痔;恶性肿瘤;胆囊疾病;胃痛、腹痛症状;白内障;腰椎病;骨折;胃肠炎;心律失常;抑郁症、焦虑症;肾结石、尿道结石等。将上述因子及年龄、性别、住院次数、门诊次数、总费用全部放入逻辑回归模型,剔除无预测价值的变量,最终所述初始模型以性别、年龄、住院次数、门诊次数、糖尿病、高血压、头晕头痛症状、胸闷胸痛症状、慢性阻塞性肺疾病(chronicobstructivepulmonarydisease,COPD)、心律失常作为变量。S202,尝试添加其他特征作为变量并进行降维处理,以对所述初始模型进行优化。具体地,可以在所述初始模型的基础上挑选下列三种特征进行添加:第一种是地区医疗信息系统中的其他疾病因子,因为疾病特征的长尾效应,所以将ICD-10(InternationalClassificationofDiseases-10,国际疾病分类-第10次修订本)编码前三位相同的疾病归为一类,最后选择患病人数大于1000的疾病种类作为变量。第二种是药物或治疗项目,首先进行单变量筛选,将每个特征依次加入包含年龄和性别的逻辑回归模型中,筛选出概率P<0.0001的特征,然后再对筛选出的特征进行降维处理。第三种是就诊医本文档来自技高网...
风险预测方法及系统

【技术保护点】
一种风险预测方法,其特征在于,该方法包括步骤:从地区医疗信息系统中收集与心脑血管相关的基础数据;基于所述基础数据建立广义线性逻辑回归模型;及根据所述广义线性逻辑回归模型预测个人心脑血管发生概率。

【技术特征摘要】
1.一种风险预测方法,其特征在于,该方法包括步骤:从地区医疗信息系统中收集与心脑血管相关的基础数据;基于所述基础数据建立广义线性逻辑回归模型;及根据所述广义线性逻辑回归模型预测个人心脑血管发生概率。2.根据权利要求1所述的风险预测方法,其特征在于,所述基础数据包括所述地区内满足预设年龄且排除当年本身患有心脑血管疾病的人群在预设历史时间段内的个人疾病史和用药史信息。3.根据权利要求1所述的风险预测方法,其特征在于,所述基于所述基础数据建立广义线性逻辑回归模型的步骤具体包括:根据心脑血管疾病的主要疾病因子构建初始模型;尝试添加其他特征作为变量并进行降维处理,以对所述初始模型进行优化;根据优化结果生成最终模型。4.根据权利要求3所述的风险预测方法,其特征在于,所述初始模型以性别、年龄、住院次数、门诊次数、糖尿病、高血压、头晕头痛症状、胸闷胸痛症状、慢性阻塞性肺疾病、心律失常作为变量。5.根据权利要求3所述的风险预测方法,其特征在于,所述降维处理采用主成分分析法进行降维。6.根据权利要求3所述的风险预测方法,其特征在于,所述最终模型以年龄、性别、门诊就诊次数、高血压、糖尿病、头晕头痛眩晕,以及多个机构就诊次数特征、科室就诊次数特征、药物/...

【专利技术属性】
技术研发人员:孙继超徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1