一种基于一致性正则化的半监督脑电信号分类方法技术

技术编号:30015324 阅读:14 留言:0更新日期:2021-09-11 06:21
本发明专利技术公开了一种基于一致性正则化的半监督脑电信号分类方法,包括:1、选取部分数据进行标注,并进行预处理;2、搭建人工神经网络,并作为特征处理器;3、对输入进行随机增强,促使样本在输入空间上出现一定的波动;4、记录每次迭代得到的输出概率,当前的结果与历史的结果进行指数滑动平均集成;5、设计损失函数,在交叉熵损失函数的基础上,设计无监督的一致性正则项优化决策边界;6、利用组合后的损失函数优化模型参数,获得最优分类模型。本发明专利技术能够在仅有一小部分数据被标注的情况下,充分利用无标注数据来优化决策边界,从而取得较为理想的脑电信号分类性能,在医疗等应用领域,对减轻标注成本有重要意义。轻标注成本有重要意义。轻标注成本有重要意义。

【技术实现步骤摘要】
一种基于一致性正则化的半监督脑电信号分类方法


[0001]本专利技术属于脑电信号处理领域,具体的说是一种基于一致性正则化的半监督脑电信号分类方法。

技术介绍

[0002]脑电信号(EEG,Electroencephalography)是记录脑电活动的有力工具,能够准确地区分不同的脑部状态。近年来,脑电信号的自动分类越来越多的关注,在癫痫检测、情绪识别和睡眠监护等领域都有重大的应用价值。目前,脑电信号分类方法主要分为两大类:传统机器学习算法和深度学习算法。
[0003]传统机器学习算法的关键在于特征工程,它需要人工设计具有高区分度的特征。常用的人工特征可以分为两大类:线性特征和非线性特征。线性特征主要包括自回归系数、方差、谱能量和Hjorth描述符等,非线性特征主要包括动态相似指数、Lyapunov指数和相位同步系数等。人工特征的设计要求研究人员具有高度深入的专业知识,且因为脑电信号固有的非平稳性,设计鲁棒的特征困难度极高。
[0004]近年来,深度学习算法被广泛的应用到脑电信号分类中,并取得了巨大的成功,常见的网络结构有深度置信网络、卷积神经网络、长短时记忆网络等。深度学习避免了人工特征的设计,采用数据驱动的方式,驱动人工神经网络自动提取数据中的特征,从而实现分类,并取得显著的分类效果。
[0005]然而,深度学习的成功依赖于大量带标注的数据。目前基于深度学习的脑电信号分类算法多采用全监督模式,在训练过程中,需要大量带标注的样本,才能取得可靠的决策边界。现实中,对脑电的标注成本极高,不仅要求相应病理学家有相当丰富的经验,而且十分耗时。这限制了深度学习方法在脑电信号分类中的进一步发展。

技术实现思路

[0006]本专利技术是为了解决上述现有技术存在的不足之处,提出一种基于一致性正则化的半监督脑电信号分类方法,以期能充分利用无标注数据来优化决策边界以减轻对标注数据的依赖,并取得较为理想的脑电信号分类性能。
[0007]本专利技术为达到上述专利技术目的,采用如下技术方案:
[0008]本专利技术一种基于一致性正则化的半监督脑电信号分类方法的特点在于,包括以下步骤:
[0009]步骤1、获取脑电信号数据集,并利用随机函数选取部分数据进行标注,得到带标注的数据集;将其余的脑电信号数据集作为无标注的数据集;
[0010]步骤2、对所有数据统一进行切片分割、短时傅里叶变换、去噪的预处理;
[0011]步骤2.1、利用滑窗法分别将带标注的数据集和无标注的数据集切分为长度为l的片段,得到带标注的样本集和无标注的样本集;
[0012]步骤2.2、采用短时傅里叶变换分别将带标注的样本集和无标注的样本集转换为
带标注的时频样本集和无标注的时频样本集;
[0013]步骤2.3、在频域上分别移除所述带标注的时频样本集和无标注的时频样本集的部分频率成分,以去除工频干扰和直流分量,从而得到带标注的去噪时频样本集L和无标注的去噪时频样本集U;其中,对于任意一个样本x,赋予一个标记标量I,当I=0时,表示样本x属于无标注的去噪时频样本集U,即x∈U;当I=1时,表示样本x属于带标注的去噪时频样本集L,即x∈L,当x∈L时,令样本x的标注y∈{0,...,C

1},其中,C代表类别数;
[0014]步骤3、搭建人工神经网络f
θ
,并作为特征处理器,其中,θ表示网络参数;
[0015]步骤4、将去噪时频样本集L和U合并,再构建随机增强函数ξ(x)对合并后的样本集中的每个样本x进行增强处理,得到增强后的合并样本集;
[0016]步骤5、将增强后的合并样本集分批次地输入到人工神经网络f
θ
中进行训练,并对增强后的合并样本集中每一个增强样本记录每次迭代得到的输出概率;将当前第t次迭代的输出概率z
t
与历史的输出概率进行指数滑动平均后再除以校正因子,从而得到目标集成输出概率
[0017]步骤6、设计损失函数,建立优化目标;
[0018]通过标记I=1从增强后的合并样本集中找出带标注的样本,并利用交叉熵损失L
c
来计算当前第t次迭代的输出概率z
t
与真实标注y的偏差;
[0019]对增强后的合并样本集中所有样本,构建无监督的一致性正则项L
con
来约束当前第t次迭代的输出概率z
t
与目标集成输出概率间的偏差;
[0020]构建随迭代次数t逐步增加的加权函数ω(t),从而得到组合后的损失函数L=L
c
+ω(t)L
con

[0021]步骤7、基于组合后的损失函数L,使用优化器构建动态的学习率策略来更新人工神经网络f
θ
的网络参数θ,从而获得最优分类模型;
[0022]利用最优分类模型对任一脑电信号样本进行分类,并得到对应类别的概率值,按照所设的阈值,对所得到的概率值进行二值化分类,从而得到最终的分类结果。
[0023]与现有技术相比,本专利技术的有益效果在于:
[0024]1、本专利技术设计半监督学习策略,能够在仅有一小部分数据被标注的情况下,充分利用无标注数据来大幅提升分类准确率。
[0025]2、本专利技术通过添加高斯噪声,结合网络固有的Dropout机制,促使同一输入在不同时刻的输出出现一定的偏差;而样本本身的类别属性应维持不变,对此,本专利技术设计一致性正则项驱使神经网络消除这种偏差,能在不需要标注信息的情况下,实现了对分类决策边界的优化,从而提升了分类性能。
附图说明
[0026]图1为本专利技术方法流程图;
[0027]图2为本专利技术构建的卷积神经网络结构图;
[0028]图3为本专利技术设计的一致性正则化原理示意图;
[0029]图4为本专利技术方法的半监督训练策略示意图。
具体实施方式
[0030]本实施例中,一种基于一致性正则化的半监督脑电信号分类方法,如图1所示,其包括如下步骤:
[0031]步骤1、获取脑电信号数据集,并利用随机函数选取部分数据进行标注,得到带标注的数据集;将其余的脑电信号数据集作为无标注的数据集;
[0032]具体实施中,若训练集中存在N条长时的EEG记录,用random函数随机选择1条记录进行人工标注,剩下的不进行标注。
[0033]步骤2、对所有数据统一进行切片分割、短时傅里叶变换、去噪的预处理;
[0034]步骤2.1、利用滑窗法分别将带标注的数据集和无标注的数据集切分为长度为l的片段,得到带标注的样本集和无标注的样本集;
[0035]具体实施中,对滑窗法,取窗口长度l=30,即统一切分成长为30秒的片段;
[0036]步骤2.2、采用短时傅里叶变换分别将带标注的样本集和无标注的样本集转换为带标注的时频样本集和无标注的时频样本集;
[0037]步骤2.3、在频域上分别移除带标注的时频样本集和无标注的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于一致性正则化的半监督脑电信号分类方法,其特征在于,包括以下步骤:步骤1、获取脑电信号数据集,并利用随机函数选取部分数据进行标注,得到带标注的数据集;将其余的脑电信号数据集作为无标注的数据集;步骤2、对所有数据统一进行切片分割、短时傅里叶变换、去噪的预处理;步骤2.1、利用滑窗法分别将带标注的数据集和无标注的数据集切分为长度为l的片段,得到带标注的样本集和无标注的样本集;步骤2.2、采用短时傅里叶变换分别将带标注的样本集和无标注的样本集转换为带标注的时频样本集和无标注的时频样本集;步骤2.3、在频域上分别移除所述带标注的时频样本集和无标注的时频样本集的部分频率成分,以去除工频干扰和直流分量,从而得到带标注的去噪时频样本集L和无标注的去噪时频样本集U;其中,对于任意一个样本x,赋予一个标记标量I,当I=0时,表示样本x属于无标注的去噪时频样本集U,即x∈U;当I=1时,表示样本x属于带标注的去噪时频样本集L,即x∈L,当x∈L时,令样本x的标注y∈{0,...,C

1},其中,C代表类别数;步骤3、搭建人工神经网络f
θ
,并作为特征处理器,其中,θ表示网络参数;步骤4、将去噪时频样本集L和U合并,再构建随机增强函数ξ(x)对合并后的样本集中的每个样本x进行增强处理,得到增强后的合并...

【专利技术属性】
技术研发人员:陈勋梁邓刘爱萍张勇东吴枫
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1