一种基于改进多基分类器集成的自动心律失常分析方法技术

技术编号:29216093 阅读:16 留言:0更新日期:2021-07-10 00:54
本发明专利技术公开了一种基于改进多基分类器集成的自动心律失常分析方法,包括以下步骤:预处理模块,包括心电信号降噪、心拍识别及截取;分类模块,包括用以对心电图数据进行心律失常自动分类的XGBoost分类模块、GBDT分类模块、BiGRU分类模块;融合模块,用以依据模型集成规则—Stacking,将分类模块产生的第一分类结果、第二分类结果及第三分类结果进行集成,得到集成数据;然后利用浅层神经网络对心律失常集成数据进行分类,得到最终的心率失常分类融合结果。如此,本发明专利技术将XGBoost、GBDT、BiGRU三种基分类器的分类结果利用Stacking集成规则进行融合,采用机器学习模型与深度学习模型相结合的方法,提升了心律失常整体分类性能及准确率。确率。确率。

【技术实现步骤摘要】
一种基于改进多基分类器集成的自动心律失常分析方法


[0001]本专利技术涉及医学信号处理
,具体为一种基于改进多基分类器集成的自动心律失常分析方法。

技术介绍

[0002]心律指心跳的节奏。正常人的心脏跳动频率每分钟约为60~100次,并且健康的心律应该是十分均匀的,心脏病或心脏神经调节功能不正常时,可出现心律不齐或心律失常。心律失常是心血管疾病常见且最为严重的病症之一,可导致患者突然死亡,严重威胁人类健康。
[0003]如今,随着人工智能技术的发展,智能辅助诊断系统因其快速、可靠的特点已成为最具前景的临床诊断解决方案。由于心电远程监护技术的迅速发展和普及,以及当下可穿戴设备的流行我们可以很容易地得到病人的心电信号以及其他生理特征。传统上,医生可以通过观察心电信号中蕴含的信息来判断病人是否患心律失常,然而仅通过观察变化微弱的心电信号来推断病人状态的过程是费力的,并且容易因复杂的心电变化而产生错误的判断。因此,利用计算机来进行智能辅助的诊断系统可以克服对心电信号的评估限制,从而更好的辅助医生对病人心律失常的患病情况进行推断。

技术实现思路

[0004](一)解决的技术问题
[0005]针对现有技术的不足,本专利技术提供了一种基于改进多基分类器集成的自动心律失常分析方法,提升心律失常的检测效果。
[0006](二)技术方案
[0007]为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于改进多基分类器集成的自动心律失常分析方法,包括以下步骤:
[0008]S1:数据预处理,读入12导联的心电信号的数据,采用小波变换滤除原始心电信号中的工频干扰,采用巴特沃斯带阻滤波器滤除肌电干扰,采用中值滤波滤除原始心电信号中的基线漂移;
[0009]S2:心拍数据提取,通过小波变换检测R波位置,进而对R波前后数据点进行固定长度截取,从而完成对心拍数据提取;
[0010]S3:基分类器模型构建,包括用以对心电图数据进行心律失常自动分类的XGBoost分类模块、GBDT分类模块、BiGRU分类模块;其中,XGBoost作为第一基分类模块、GBDT作为第二基分类模块、GRU作为第三基分类模块,通过对训练数据进行K折交叉的划分,使得XGBoost输出K个第一分类结果,GBDT输出K个第二分类结果,BiGRU输出K个第三分类结果;
[0011]S4:模型融合,依据模型集成规则—Stacking,将分类模块产生的第一分类结果、第二分类结果及第三分类结果进行集成,得到集成数据,然后搭建好浅层神经网络以对心律失常集成数据进行分类;
[0012]S5:训练模型参数,初始化所述集成模型的参数,将构建好的数据集拆分为训练集和测试集;利用训练集样本对集成模型进行训练,生成所述集成模型的参数并保存;
[0013]S6:模型预测,对测试集样本进行自动识别,获得心律失常的二分类结果。
[0014]优选的,步骤S2具体包括:
[0015]读取降噪后12导联的心电信号数据,对每个导联心电信号根据同一时刻R波峰值处的位置固定向前截取200个样本点,向后截取400个样本点,使得每个导联的每个心拍固定截取600个点的数据,对相同时刻R波顶点每个导联所截取的600个点的心电信号进行行级上的拼接,此时原始每个心拍的心电信号的数据形成12*600维的样本,作为基分类模型的输入数据X。
[0016]优选的,步骤S3具体包括:
[0017]XGBoost分类模块,其作为第一分类模快,通过对训练数据进行3折交叉的划分,使得XGBoost输出3个第一分类结果,其中,对每个心电样本的预测表示为:
[0018][0019]其中x
i
∈R
12*600
是第i个心电训练样本,f
k
表示第k棵树,表示样本x
i
的预测结果。在建模过程中不断优化目标函数,使其最小,表示为:
[0020][0021]其中是样本训练误差,Ω(f
i
)是树的正则项,XGBoost通过将Obj
t
使用二阶泰勒公式展开得:
[0022][0023]其中,g
i
、h
i
表示在第i个样本下泰勒展开式的一阶导数、二阶导数,通过公式8可以得到Obj
t
关于w
j
的一元二次方程,由此找到使Obj
t
取值最小的w
j
,表示为:
[0024][0025]其中,G
j
=∑g
i
;H
j
=∑h
i
,通过上述步骤完成第t棵树的建立,从而完成XGBoost模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A
1XGBoost
、A
2XGBoost
、A
3XGBoost
和对应的针对测试集的预测结果B
1XGBoost
、B
2XGBoost
、B
3XGBoost

[0026]GBDT分类模块,其作为第二分类模块,通过对训练数据进行3折交叉的划分,使得GBDT输出3个第二分类结果,表示为:
[0027]使用负二项对数似然作为损失函数,表示为:
[0028]L(y,F)=ylog(P(y=1|x))+(1

y)log(1

P(y=1|x)),y∈{0,1}
ꢀꢀꢀ
(5)
[0029]计算第m

1棵树的预测函数的当前梯度值:
[0030][0031]其中F
m
‑1(x)是第m

1棵树的预测函数,x
i
∈R
12*600
是第i个训练集心电样本,y~
i
为第i个样本的预测分类概率值,
[0032]将回归树作为基学习器,进行线性搜索以得到最优叶子节点值,使用Ne wton

Raphson近似:
[0033][0034]其中R
m,j
为第m棵树对应的叶子结点区域,第m棵树的预测概率函数如下:
[0035][0036]F
m
(x)为第m棵树的预测概率函数,预测样本的正分类概率为:
[0037][0038]通过上述步骤完成第m棵树的建立,从而完成GBDT模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A
1GBDT
、A
2GBDT
、A
3GBDT
和对应的针对测试集的预测结果B
1GBDT
、B
2GBDT
、B
3GBDT

[0039]BiGRU分类模块,其作为第三分类模块,通过对训练数据进行3折交叉的划分,使得Bi本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,包括以下步骤:S1:数据预处理,读入12导联的心电信号的数据,采用小波变换滤除原始心电信号中的工频干扰,采用巴特沃斯带阻滤波器滤除肌电干扰,采用中值滤波滤除原始心电信号中的基线漂移;S2:心拍数据提取,通过小波变换检测R波位置,进而对R波前后数据点进行固定长度截取,从而完成对心拍数据提取;S3:基分类器模型构建,包括用以对心电图数据进行心律失常自动分类的XGBoost分类模块、GBDT分类模块、BiGRU分类模块;其中,XGBoost作为第一基分类模块、GBDT作为第二基分类模块、GRU作为第三基分类模块,通过对训练数据进行K折交叉的划分,使得XGBoost输出K个第一分类结果,GBDT输出K个第二分类结果,BiGRU输出K个第三分类结果;S4:模型融合,依据模型集成规则—Stacking,将分类模块产生的第一分类结果、第二分类结果及第三分类结果进行集成,得到集成数据,然后搭建好浅层神经网络以对心律失常集成数据进行分类。S5:训练模型参数,初始化所述集成模型的参数,将构建好的数据集拆分为训练集和测试集;利用训练集样本对集成模型进行训练,生成所述集成模型的参数并保存。S6:模型预测,对测试集样本进行自动识别,获得心律失常的二分类结果。2.如权利要求2所述的一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,步骤S2,具体包括:读取降噪后12导联的心电信号数据,对每个导联心电信号根据同一时刻R波峰值处的位置固定向前截取200个样本点,向后截取400个样本点,使得每个导联的每个心拍固定截取600个点的数据,对相同时刻R波顶点每个导联所截取的600个点的心电信号进行行级上的拼接,此时原始每个心拍的心电信号的数据形成12*600维的样本,作为基分类模型的输入数据X。3.如权利要求2所述的一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,步骤S3,具体包括:XGBoost分类模块,其作为第一分类模快,通过对训练数据进行3折交叉的划分,使得XGBoost输出3个第一分类结果,其中,对每个心电样本的预测表示为:其中x
i
∈R
12*600
是第i个心电训练样本,f
k
表示第k棵树,表示样本x
i
的预测结果。在建模过程中不断优化目标函数,使其最小,表示为:其中是样本训练误差,Ω(f
i
)是树的正则项,XGBoost通过将Obj
t
使用二阶泰勒公式展开得:其中,g
i
、h
i
表示在第i个样本下泰勒展开式的一阶导数、二阶导数,通过公式8可以得到
Obj
t
关于w
j
的一元二次方程,由此找到使Obj
t
取值最小的w
j
,表示为:其中,G
j
=∑g
i
;H
j
=∑h
i
,通过上述步骤完成第t棵树的建立,从而完成XGBoost模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A
1XGBoost
、A
2XGBoost
、A
3XGBoost
和对应的针对测试集的预测结果B
1XGBoost
、B
2XGBoost
、B
3XGBoost
;GBDT分类模块,其作为第二分类模块,通过对训练数据进行3折交叉的划分,使得GBDT输出3个第二分类结果,表示为:使用负二项对数似然作为损失函数,表示为:L(y,F)=ylog(P(y=1|x))+(1

y)log(1

P(y=1|x)),y∈{0,1}
ꢀꢀꢀ
(5)计算第m

1棵树的预测函数的当前梯度值:其中F
m
‑1(x)是第m

1棵树的预测函数,x
i
∈R
12*600
是第i个训练集心电样本,为第i个样本的预测分类概率值,将回归树作为基学习器,进行线性搜索以得到最优叶子节点值,使用Ne wton

Raphson近似:其中R
m,j
为第m棵树对应的叶子结点区域,第m棵树的预测概率函数如下:F
m
(x)为第m棵树的预测概率函数,预测样本的正分类概率为:通过上述步骤完成第m棵树的建立,从而完成GBDT模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A
1GBDT
、A
2GBDT
、A
3GBDT
和对应的针对测试集的预测结果B
1GBDT
、B
2GBDT
、B
3GBDT
;BiGRU分类模块,其作为第三分类模块,通过对训练数据进行3折交叉的划分,使得BiGRU输出3个第三分类结果,具体的,所BiGRU深度神经网络采用的公式如下:z
t
=σ(W
z
·
[h
t
...

【专利技术属性】
技术研发人员:张蓝天吴松
申请(专利权)人:北京芯动卫士科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1