基于LR-N的心血管疾病预测方法技术

技术编号:30019135 阅读:14 留言:0更新日期:2021-09-11 06:34
本发明专利技术公开了一种基于LR

【技术实现步骤摘要】
基于LR

N的心血管疾病预测方法


[0001]本专利技术涉及计算机技术应用
,特别涉及一种基于LR

N的心血管疾病预测方法。

技术介绍

[0002]随着我国科技的不断发展,各领域数据以指数级别增长,传统的统计方法已不能满足现代人们的需要,如何在大规模的数据里挖掘有用的信息,分析预测新的数据,成为各行各业所研究的问题,医学领域也是如此。医学数据具有特殊性和复杂性,要想挖掘出医学数据背后潜在有用的信息,对于算法的速度与精准度都有着更高层次的要求。机器学习预测模型将疾病诊断的过程看作以疾病症状为特征的预测问题,根据疾病特征建立样本空间,将已有病历的样本和目标变量作为训练集合,采用机器学习模型训练预测函数,从而实现对新病例的预测分析。此外,疾病预测模型作为医疗智能辅助决策支持系统的重要组成部分,能够及时发现潜在的风险,将潜在病例召回,具有更小的决策风险和更重要的辅助决策意义,因此疾病预测模型的研究是非常具有前瞻性和重大现实意义的课题。
[0003]心血管疾病是一种常见的疾病,严重威胁人类的健康。据研究,心血管疾病已经成为世界上最主要的死亡原因,在中国尤为严重。所以建立一个针对心血管疾病的疾病预测模型对人类医学研究有着非常重要的意义。心血管疾病预测模型要求更高的准确率来帮助医生辅助诊断,也要求更高的召回率将潜在病例召回。逻辑回归模型具有很强的解释性,能够使人们更好的理解模型决策的原因。但逻辑回归模型的损失函数易陷入局部最优的问题,会影响预测效果,且收敛时间慢。
专利
技术实现思路

[0004]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此,本专利技术的目的在于提出一种基于LR

N的心血管疾病预测方法,该方法解决逻辑回归算法损失函数容易容易陷入局部最优的问题。
[0006]为达到上述目的,本专利技术实施例提出了基于LR

N的心血管疾病预测方法,包括以下步骤:步骤S1,采集多个心血管疾病患者的医疗信息,对所述医疗信息进行归一化处理,得到训练样本和测试样本;步骤S2,对所述训练样本进行筛选,得到样本特征向量;步骤S3,建立逻辑回归模型,利用所述样本特征向量对所述逻辑回归模型进行训练,得到逻辑回归心血管疾病预测模型;步骤S4,采用Nadam算法对所述逻辑回归疾病预测模型的损失函数进行迭代优化,直至当前分类结果与实际分类结果的误差小于预设值或达到预设迭代次数,得到LR

N心血管疾病预测模型;步骤S5,将所述测试样本输入所述LR

N心血管疾病预测模型,得到预测结果。
[0007]本专利技术实施例的基于LR

N的心血管疾病预测方法,解决了逻辑回归模型损失函数易陷入局部最优的问题,使得损失函数最小化,且能显著改善心血管疾病预测效果,能够准确的判断是否患有心血管疾病,对心血管疾病的预测和治疗具有非常重要的意义。
[0008]另外,根据本专利技术上述实施例的基于LR

N的心血管疾病预测方法还可以具有以下附加的技术特征:
[0009]进一步地,在本专利技术的一个实施例中,所述步骤S1中将所述医疗信息中的"age","height","weight","ap_hi","ap_lo"字段进行归一化处理。
[0010]进一步地,在本专利技术的一个实施例中,所述步骤S2中利用热力图对所述训练样本中的数据向量的相关性进行分析,筛选出所述样本特征向量。
[0011]进一步地,在本专利技术的一个实施例中,所述步骤S3具体包括:
[0012]步骤S301,结合Sigmoid函数和线性回归算法,将线性回归模型的输出作为Sigmoid函数的输入,得到逻辑回归模型,具体为:
[0013][0014]其中,x=x1,x2,x3,

,x
n
为样本特征向量的输入向量,θ
T
x为目标变量;
[0015]步骤S302,利用所述样本特征向量对所述逻辑回归模型进行训练,得到逻辑回归心血管疾病预测模型,具体为:
[0016]P(y|x;θ)=(h
θ
(x))
y
*(1

h
θ
(x))1‑
y
[0017]其中,x=x1,x2,x3,

,x
n
为样本特征向量的输入向量,θ为权值向量是逻辑回归模型的参数,y为预测结果,h
θ
(x)为预测结果为1的概率,1

h
θ
(x)为预测结果为0的概率。
[0018]进一步地,在本专利技术的一个实施例中,所述预测结果为1的概率为:
[0019]h
θ
(x)=P(y=1|x;θ)
[0020]所述预测结果为0的概率为:
[0021]1‑
h
θ
(x)=P(y=0|x;θ)
[0022]其中,x=x1,x2,x3,

,x
n
为样本特征向量的输入向量,θ为权值向量是逻辑回归模型的参数,y为预测结果。
[0023]进一步地,在本专利技术的一个实施例中,所述步骤S4具体包括:
[0024]步骤S401,根据所述逻辑回归心血管疾病预测模型构造似然函数,具体为:
[0025][0026]其中,x=x1,x2,x3,

,x
n
为样本特征向量的输入向量,θ为权值向量是逻辑回归模型的参数,y为预测结果,h
θ
(x)为预测结果为1的概率,1

h
θ
(x)为预测结果为0的概率;
[0027]步骤S402,根据所述似然函数构造所述逻辑回归疾病预测模型的损失函数,具体为:
[0028][0029]步骤S403,利用Nadam算法对所述损失函数进行迭代优化,不断修正所述逻辑回归疾病预测模型,直至所述损失函数小于所述预设值或达到所述预设迭代次数,得到所述逻辑回归心血管疾病预测模型。
[0030]进一步地,在本专利技术的一个实施例中,还包括:
[0031]步骤S6,构建所述逻辑回归心血管疾病预测模型的混淆矩阵;
[0032]步骤S7,根据所述混淆矩阵分别求解所述所述逻辑回归心血管疾病预测模型的多
个指标的分类效果,完成自评估。
[0033]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0034]本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0035]图1是本专利技术一个实施例的基于LR

N的心血管疾病预测方法的流程图;
[0036]图2是本专利技术一个实施例的Sigmoid函数图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于LR

N的心血管疾病预测方法,其特征在于,包括以下步骤:步骤S1,采集多个心血管疾病患者的医疗信息,对所述医疗信息进行归一化处理,得到训练样本和测试样本;步骤S2,对所述训练样本进行筛选,得到样本特征向量;步骤S3,建立逻辑回归模型,利用所述样本特征向量对所述逻辑回归模型进行训练,得到逻辑回归心血管疾病预测模型;步骤S4,采用Nadam算法对所述逻辑回归疾病预测模型的损失函数进行迭代优化,直至当前分类结果与实际分类结果的误差小于预设值或达到预设迭代次数,得到LR

N心血管疾病预测模型;步骤S5,将所述测试样本输入所述LR

N心血管疾病预测模型,得到预测结果。2.根据权利要求1所述的基于LR

N的心血管疾病预测方法,其特征在于,所述步骤S1中将所述医疗信息中的"age","height","weight","ap_hi","ap_lo"字段进行归一化处理。3.根据权利要求1所述的基于LR

N的心血管疾病预测方法,其特征在于,所述步骤S2中利用热力图对所述训练样本中的数据向量的相关性进行分析,筛选出所述样本特征向量。4.根据权利要求1所述的基于LR

N的心血管疾病预测方法,其特征在于,所述步骤S3具体包括:步骤S301,结合Sigmoid函数和线性回归算法,将线性回归模型的输出作为Sigmoid函数的输入,得到逻辑回归模型,具体为:其中,x=x1,x2,x3,

,x
n
为样本特征向量的输入向量,θ
T
x为目标变量;步骤S302,利用所述样本特征向量对所述逻辑回归模型进行训练,得到逻辑回归心血管疾病预测模型,具体为:P(y|x;θ)=(h
θ
(x))
y
*(1

h
θ
(x))1‑
y
其中,x=x1,x2,x3,...

【专利技术属性】
技术研发人员:陈海龙杜梅张颖宇杨畅
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1