一种基于聚类降维的集成学习睡眠分期方法技术

技术编号:38597068 阅读:10 留言:0更新日期:2023-08-26 23:32
一种基于聚类降维的集成学习睡眠分期方法,包括以下步骤:获取单通道EEG数据,同时初始化SVM分类器;对EEG数据进行特征提取,每个时段提取一个特征向量,作为一个数据点;进行特征选择和特征分类,为分类器分别选择特征集,基分类器的训练;对于测试数据,选择概率最大的分期作为测试数据的预测结果;本发明专利技术使用单通道EEG信号作为输入,极大的降低了输入信号的采集难度,并且提出的进行特征选择和特征分类,针对不同的特征空间,都具有良好的适应性;因此本发明专利技术可以快速、准确、实时地的进行睡眠分期。眠分期。眠分期。

【技术实现步骤摘要】
一种基于聚类降维的集成学习睡眠分期方法


[0001]本专利技术属于医疗信息学
,特别涉及一种基于聚类降维的集成学习睡眠分期方法,使用SVM(Supportvectormachine,支持向量机)作为基分类器实现睡眠分期。

技术介绍

[0002]睡眠占据了人一生1/3的时间,睡眠质量和人的身体和心理健康密切相关。相关研究表明,正常睡眠模式的破坏将会导致心理和神经的失调,此外,睡眠失调还会对认知功能产生更加深远的影响,如注意力下降、学习能力减退、记忆力衰减等。睡眠分期是指根据睡眠过程中脑电(Electroencephalogram,EEG)、眼电(Electrooculogram,EOG)、心电(Electrocardiogram,ECG)、血氧饱和度等生理指标的周期性变化,将睡眠过程划分为不同阶段。睡眠分期诊断结果不但对睡眠疾病的诊断有重要意义,而且是睡眠过程中的神经干预治疗的前提
[2]。当下睡眠脑电研究中常用的是AASM标准(American academy ofsleep medicine),该标准将睡眠划分为清醒阶段(Wake),非快眼动睡眠期(Non

rapid eye movement,Nrem),快速眼动睡眠期(Rapid eye movement,Rem),其中Nrem期又细分为N1,N2,N3三个时期。
[0003]然而,传统的睡眠分期是由医生,基于多导睡眠监测仪(Polysomnography,PSG)的生理信号数据,通过观察得出的。针对整夜睡眠数据,依靠医师凭借观察进行睡眠分期,会产生巨大工作量,而且难以实现实时分析,此外睡眠分期结果的准确度还严重依赖于医师的经验。故而,当下睡眠医学领域急需一种能准确进行睡眠分期的自动睡眠分期方法。
[0004]现有的睡眠分期算法分为多通道信号处理和单通道信号处理两种,例如多通道算法的文章《S.Khalighi,T.Sousa,G.Pires,U.Nunes,Automatic sleep staging:a computer assisted approach for optimal combination of features and polysomnographic channels,Expert Syst.Appl.40(17)(2013)7046

7059.》,虽然加入更多的生理信号通道确实能提升分类算法的准确性,但是也会产生更大的时间开销和内存开销。而且多通道算法依赖于更多的信号采集设备,这不但会使诊断过程变得繁琐,而且多设备之间的干扰也会引入随机噪声,使得算法性能不稳定。此外,如果要实现实时睡眠分期,多通道处理算法是难以与单通道算法相比的。
[0005]当下已有很多研究表明,单通道的EEG信号足够实现睡眠分期,例如《Boostani R,Karimzadeh F,Nami M.A comparative review on sleep stage classification methods in patients and healthy individuals[J].Computer Methods and Programs in Biomedicine.2016,140(2017):77

91.》,而针对单通道EEG信号的睡眠分期算法,目前主要分为基于特征提取的传统机器学习算法和端到端的深度学习算法两大类,有研究表明,传统机器学习方法在睡眠分期领域能达到与深度学习算法相当的分类性能。专利申请号为CN202310356676.3的《基于时间自注意力与动态图卷积的睡眠分期分析系统与方法》,该方法接受多通道脑电的特征作为输入,采用了自注意力机制和动态图卷积作为分类模型,实现睡眠分期。虽然该方法具有不错的分类效果,但是多通道脑电信号输入使得信号采
集过程更加繁杂,此外,在不使用GPU加速的情况下,在多通道脑电庞大的样本空间上布置注意力网络和动态图卷积,必定会带来巨大的计算时间开销。对于需要布置在治疗型设备上的睡眠分期算法而言,诸如此类的深度学习网络并不能满足要求。

技术实现思路

[0006]为了克服上述现有技术的缺陷,本专利技术的目的在于提供一种基于聚类降维的集成学习睡眠分期方法,考虑到训练数据的标签由医师手动标定,有一定概率存在偏差,提出了基于聚类的特征选择方法,使用SVM作为基分类器,算法具有较低的时间开销和内存开销,此外,使用单通道EEG信号作为输入,极大的降低了输入信号的采集难度,并且提出的进行特征选择和特征分类,针对不同的特征空间,都具有良好的适应性,因此本专利技术可以快速、准确、实时地的进行睡眠分期。
[0007]为了达到上述目的,本专利技术的技术方案为:
[0008]一种基于聚类降维的集成学习睡眠分期方法,包括以下步骤:
[0009]步骤一,获取单通道EEG数据和专业医师的睡眠分期诊断结果,对EEG数据的每个时段数据进行带通滤波,同时初始化SVM分类器;
[0010]步骤二,对EEG数据进行特征提取,每个时段提取一个特征向量,作为一个数据点;
[0011]步骤三,进行特征选择和特征分类,为分类器分别选择特征集,选择需要保留的特征,将保留的特征分配到特征集;
[0012]步骤四,训练模型,步骤一中的专业医师的睡眠分期诊断结果作为训练数据的标签;采用步骤三为每个分类器选择的特征子集,从特征空间中产生五个子空间,分别用于五个基分类器的训练;每个基分类器进行独立训练,经过训练后,每个基分类器能够给出预测一个样本,为相应睡眠阶段是和否的概率;
[0013]步骤五,对于测试数据,{SVM0,SVM1,SVM2,SVM3,SVM4}分别给出对应睡眠阶段是和否的概率,集成五个分类器的输出后得出测试数据判别为五个分期的概率,选择概率最大的分期作为测试数据的预测结果。
[0014]所述步骤一具体为:首先将EEGG数据按时段进行划分,以时段为最小处理单元,分别使用Butterworth滤波器进行0.5

45Hz的带通滤波,同时初始化5个SVM分类器,分别作为五个睡眠阶段的分类任务的基分类器,{SVM0,SVM1,SVM2,SVM3,SVM4},SVM编号为对应的睡眠分期。
[0015]所述步骤三的实施方法为:
[0016](a)、对特征空间进行数据增强,即使用复制现有数据点的方法,使得特征空间中每个睡眠阶段的数据量相同,得到增强后的总体数据集其中l
i
∈{0,1,2,3,4},(p
i
,l
i
)表示一个的样本;
[0017](b)、对特征x
i
,构建仅含该特征的数据集D(x
i
);
[0018](c)、对D(x
i
)进行k

means二聚类,得到两个簇cluster1、cluster2;
[0019](d)、分别计算两个簇的信息熵;
...

【技术保护点】

【技术特征摘要】
1.一种基于聚类降维的集成学习睡眠分期方法,其特征在于,包括以下步骤:步骤一,获取单通道EEG数据和专业医师的睡眠分期诊断结果,对EEG的每个时段数据进行带通滤波,同时初始化SVM分类器;步骤二,对EEG数据进行特征提取,每个时段提取一个特征向量,作为一个数据点;步骤三,进行特征选择和特征分类,为分类器分别选择特征集,选择需要保留的特征,将保留的特征分配到特征集;步骤四,训练模型,步骤一中的专业医师的睡眠分期诊断结果作为训练数据的标签;采用步骤三为每个分类器选择的特征子集,从特征空间中产生五个子空间,分别用于五个基分类器的训练;每个基分类器进行独立训练,经过训练后,每个基分类器能够给出预测一个样本,为相应睡眠阶段是和否的概率;步骤五,对于测试数据,{SVM0,SVM1,SVM2,SVM3,SVM4}分别给出对应睡眠阶段是和否的概率,集成五个分类器的输出后得出测试数据判别为五个分期的概率,选择概率最大的分期作为测试数据的预测结果。2.根据权利要求1所述的一种基于聚类降维的集成学习睡眠分期方法,其特征在于,所述步骤一具体为:首先将EEGG数据按时段进行划分,以时段为最小处理单元,分别使用Butterworth滤波器进行0.5

45Hz的带通滤波,同时初始化5个SVM分类器,分别作为五个睡眠阶段的分类任务的基分类器,{SVM0,SVM1,SVM2,SVM3,SVM4},SVM编号为对应的睡眠分期。3.根据权利要求1所述的一种基于聚类降维的集成学习睡眠分期方法,其特征在于,所述步骤三的实施方法为:(a)、对特征空间进行数据增强,即使用复制现有数据点的方法,使得特征空间中每个睡眠阶段的数据量相同,得到增强后的总体数据集其中l
i

【专利技术属性】
技术研发人员:丁阳王刚伍晨旭陈霸东
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1