基于特征重叠与广义决策森林的睡眠阶段分期方法及系统技术方案

技术编号:37050727 阅读:9 留言:0更新日期:2023-03-29 19:28
本发明专利技术提出一种基于特征重叠与广义决策森林的睡眠阶段分期方法及系统,涉及睡眠阶段分期的技术领域,获取心电图数据集,对其中的数据进行预处理,提取HRV特征,基于特征重要性,以重叠的方式进行特征选取,重要性程度高的HRV特征每次均作为重叠特征被选中,但重要性程度低的HRV特征不会丢弃,而是作为区域块数据输入,充分考虑HRV特征之间的区域空间相关性,有助于克服睡眠阶段数据不平衡性,从而提高了睡眠分类的准确性。最后利用广义决策森林模型进行睡眠阶段分期,避免当前随机森林结构中决策树所用的树结构会使树上层做错的决定蔓延到树的最后决定,从而导致最终结果出现错误,影响睡眠分期结果的精确度的现象发生。影响睡眠分期结果的精确度的现象发生。影响睡眠分期结果的精确度的现象发生。

【技术实现步骤摘要】
基于特征重叠与广义决策森林的睡眠阶段分期方法及系统


[0001]本专利技术涉及睡眠阶段分期的
,更具体地,涉及一种基于特征重叠与广义决策森林的睡眠阶段分期方法及系统。

技术介绍

[0002]睡眠是发生在人类身上的一个重要的、动态的、有规律的过程,是大脑活动的最重要的功能之一,在人类的生活中起着非常重要的作用。睡眠质量的好坏不仅影响工作效率,还影响身体和心理健康。早期进行睡眠质量监测和睡眠阶段分期,可有效预防睡眠障碍的恶化。
[0003]一个健康人的大脑在睡眠过程中会经历几种状态,即睡眠阶段。人体除清醒阶段外,睡眠一般分为两个期,即快速动眼阶段及非快速动眼阶段,第一阶段是非快速动眼阶段,在这一期的睡眠分为四个阶段,睡眠1阶段是睡眠潜伏期,睡眠2阶段是浅睡期,睡眠3阶段和睡眠4阶段均为深睡期,第二期就进入到快速动眼阶段,这一时期的睡眠,眼球在快速的左右转动,人体在这一期睡眠中做梦。
[0004]脑电图(EEG)、眼电图(EOG)和心电图信号的心律变异性(HRV)特征是常用于睡眠阶段分类的生物信号。基于这些信号,再结合随机森林决策是一种进行睡眠阶段分期的常用方法,如现有技术中公开了一种基于动态模态分解的睡眠阶段分类方法及系统,在睡眠阶段分类时,采用的是脑电信号和眼动信号,脑电信号结合水平眼电信号能更精准地识别睡眠的不同阶段,在采集脑电信号和眼动信号之后,对脑电信号和眼动信号进行数据增强处理,然后考虑脑电信号和眼电信号的发展过程均是非平稳、非线性的随机过程,对多通道及多采样点下的信号进行动态模态分解,最后结合随机森林决策出睡眠阶段分期结果。然而,一方面这些传统方法普遍需要选取多种不同类型的特征进行睡眠阶段分期且睡眠阶段分期效果并不显著,因此,除了选择可靠的特征进行睡眠阶段分期外,还需要优化睡眠阶段分期准确性;另一方面,由于每个人的睡眠阶段比例不同,收集到的睡眠阶段数据自然也是不平衡的,这也会导致睡眠阶段分期准确性降低。
[0005]此外,在睡眠阶段分期时,传统普遍采用的睡眠分期特征较多且数据量大,而传统随机森林决策模型通常采用单个特征作为其输入,因此,传统随机森林决策模型忽略了特征与特征之间的关联性,进而在全局上忽略了空间先验信息。而且,传统随机森林决策模型是以很多决策树组合而成的分类模型,决策树结构输出的决策结果只有一个,单一的决策结果导致可选择性少,进而限制了应用效果,影响睡眠阶段分期结果的精确度。并且,采用决策树的结构在树的上层节点属性划分错误时,树的下层节点也会出现错误,最终导致结果出现错误。

技术实现思路

[0006]为解决当前睡眠阶段分期的方式分类准确度低的问题,本专利技术提出了一种基于特征重叠与广义决策森林的睡眠阶段分期方法及系统,充分考虑特征之间的区域空间相关
性,有助于克服数据不平衡性,适用性强,提升了睡眠阶段分类效果。
[0007]为了达到上述技术效果,本专利技术的技术方案如下:一种基于特征重叠与广义决策森林的睡眠阶段分期方法,所述方法包括以下步骤:S1.获取心电图数据集,对心电图数据集中的数据进行预处理;S2.提取预处理后心电图数据集中的HRV特征数据,将HRV特征数据划分为训练集和测试集;S3.计算训练集中HRV特征数据在基础随机森林中的重要性,并将重要性按降序排序,然后以重叠的方式进行HRV特征数据选取;S4.搭建并利用训练集中以重叠方式选取的HRV特征数据训练广义决策森林模型,利用测试集检验广义决策森林模型,直至得到训练好的广义决策森林模型,用于睡眠阶段分期。
[0008]优选地,心电图数据集中的每个记录均有RR间隔和注释数据,其中,RR间隔由心电信号连续两个R波之间的时差组成,注释数据为睡眠专家标记的每30秒记录一次的睡眠阶段;对心电图数据集中的数据进行预处理时,删除无效的心电信号数据,将RR间隔与对应的注释数据进行同步,一个注释数据能有多个RR间隔。
[0009]优选地,在步骤S2中,提取的HRV特征数据包括HRV时域特征数据和HRV频域特征数据,HRV时域特征数据包括RR间隔的平均值AVNN、RR间隔的标准差SDNN、相邻RR间隔RMSSD的均方根、相邻RR间隔的差标准差SDSD、RR间隔大于50ms NN50的个数、NN50和RR间隔总和减去100 pNN50、HRV三角指数、垂直于线轴SD1和沿线轴SD2的点的标准差、线轴SD1和线轴SD2的比值以及椭圆面积;HRV频域特征数据包括总功率TP、极低频范围内的总功率VLF、低频范围LF、高频范围HF、低频与高频的比值。
[0010]优选地,睡眠阶段包括K个类别,分别为清醒阶段WAKE、快速动眼阶段REM及非快速动眼阶段NREM,设HRV特征数据f
j
对应随机森林中的结点m属于第k个睡眠阶段的概率估计值为,k=1,2,...,K,f
j
表示若干HRV特征数据中的第j个HRV特征数据;执行计算训练集中HRV特征数据在随机森林中的重要性的步骤,具体包括:计算HRV特征数据f
j
对应基础随机森林中的结点m的Gini指数,表达式为:
[0011]其中,表示HRV特征数据f
j
对应基础随机森林中的结点m的Gini指数;结点m分裂前后Gini指数变化量的表达式为:
[0012]其中,和分别表示由结点m分裂的两个新结点l和r的Gini指数;若HRV特征数据f
j
在基础随机森林第i棵决策树中出现M次,则HRV特征数据f
j
在基础随机森林第i棵决策树的重要性为:
[0013]HRV特征数据f
j
在基础随机森林中重要性的计算表达式为:
[0014]其中,n表示随机森林中决策树的数量。
[0015]在此,从宏观层面上,以某一个随机森林中的某一结点为对象,计算训练集中HRV特征数据对应结点的Gini指数,以得出HRV特征数据的重要性,这个随机森林称为基础随机森林,但与广义决策森林模型的组成不存在组成上的配合,只是可借助随机森林中结点Gini指数的概念来明确HRV特征数据的重要性。优选地,令HRV特征数据由特征向量表示,其中,已根据每个HRV特征数据的重要性以降序排序,重复若干次HRV特征数据f
j
在随机森林中重要性的计算,然后取每个HRV特征数据的重要性计算结果的均值,设表示特征数据重要性计算结果的均值的阈值,将高于阈值的所有HRV特征数据在每一次特征选取中均选中,在除之外的剩余HRV特征数据中,将按重要性顺序连续排列的每3个HRV特征数据作为一个区域块数据,每次挑选的一组HRV特征数据即包括每一次作为重叠被选中的数据及按重要性顺序连续排列的由3个HRV特征数据组成的一个区域块数据。
[0016]在此,在训练集的HRV特征数据选取时,首先考虑HRV特征数据的重要性程度,先将HRV特征数据的重要性排序,重要性程度高于阈值的HRV特征数据每次均作为重叠特征被选中,但重要性程度低于阈值的HRV特征数据也不会丢弃,而是作为区域块数据输入,充分考本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征重叠与广义决策森林的睡眠阶段分期方法,其特征在于,所述方法包括以下步骤:S1.获取心电图数据集,对心电图数据集中的数据进行预处理;S2.提取预处理后心电图数据集中的HRV特征数据,将HRV特征数据划分为训练集和测试集;S3.计算训练集中HRV特征数据在基础随机森林中的重要性,并将重要性按降序排序,然后以重叠的方式进行HRV特征数据选取;S4.搭建并利用训练集中以重叠方式选取的HRV特征数据训练广义决策森林模型,利用测试集检验广义决策森林模型,直至得到训练好的广义决策森林模型,用于睡眠阶段分期。2.根据权利要求1所述的基于特征重叠与广义决策森林的睡眠阶段分期方法,其特征在于,心电图数据集中的每个记录均有RR间隔和注释数据,其中,RR间隔由心电信号连续两个R波之间的时差组成,注释数据为睡眠专家标记的每30秒记录一次的睡眠阶段;对心电图数据集中的数据进行预处理时,删除无效的心电信号数据,将RR间隔与对应的注释数据进行同步,一个注释数据能有多个RR间隔。3.根据权利要求2所述的基于特征重叠与广义决策森林的睡眠阶段分期方法,其特征在于,在步骤S2中,提取的HRV特征数据包括HRV时域特征数据和HRV频域特征数据,HRV时域特征数据包括RR间隔的平均值AVNN、RR间隔的标准差SDNN、相邻RR间隔RMSSD的均方根、相邻RR间隔的差标准差SDSD、RR间隔大于50 msNN50的个数、NN50和RR间隔总和减去100pNN50、HRV三角指数、垂直于线轴SD1和沿线轴SD2的点的标准差、线轴SD1和线轴SD2的比值以及椭圆面积;HRV频域特征数据包括总功率TP、极低频范围内的总功率VLF、低频范围LF、高频范围HF、低频与高频的比值。4.根据权利要求1所述的基于特征重叠与广义决策森林的睡眠阶段分期方法,其特征在于,睡眠阶段包括K个类别,分别为清醒阶段WAKE、快速动眼阶段REM及非快速动眼阶段NREM,设HRV特征数据f
j
对应随机森林中的结点m属于第k个睡眠阶段的概率估计值为,k=1,2,...,K,f
j
表示若干HRV特征数据中的第j个HRV特征数据;执行计算训练集中HRV特征数据在随机森林中的重要性的步骤,具体包括:计算HRV特征数据f
j
对应基础随机森林中的结点m的Gini指数,表达式为:;其中,表示HRV特征数据f
j
对应基础随机森林中的结点m的Gini指数;结点m分裂前后Gini指数变化量的表达式为:;其中,和分别表示由结点m分裂的两个新结点l和r的Gini指数;若HRV特征数据f
j
在基础随机森林第i棵决策树中出现M次,则HRV特征数据f
j
在基础随机森林第i棵决策树的重要性为:
;HRV特征数据f
j
在基础随机森林中重要性的计算表达式为:;其中,n表示基础随机森林中决策树的数量。5.根据权利要求4所述的基于特征重叠与广义决策森林的睡眠阶段分期方法,其特征在于,令HRV特征数据由特征向量表示,其中,已根据每个HRV特征数据的重要性以降序排序,重复若干次HRV特征数据f
j
在随机森林中重要性的计算,然后取每个HRV特征数据的重要性计算结果的均值,设表示特征数据重要性计算结果的均值的阈值,将高于阈值的所有HRV特征数据在每一次特征选取中均选中,在除之外的剩余HRV特征数据中,将按重要性顺序连续排列的每3个HRV特征数据作为一个区域块数据,每次挑选的一组HRV特征数据即包括每一次作为重叠被选中的数据及按重要性顺序连续排列的由...

【专利技术属性】
技术研发人员:程映丹周杨凌永权
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1