一种基于领域泛化的脑电度量迁移学习方法技术

技术编号:33044264 阅读:18 留言:0更新日期:2022-04-15 09:26
本发明专利技术涉及一种基于领域泛化的脑电度量迁移学习方法,以脑电信号为研究对象,基于现有的度量迁移学习方法,进一步引入领域泛化思想以增强模型的泛化能力。本发明专利技术拟研究核表征学习方法,结合整体散度、域间散度、类内散度、类间散度四个方面,寻找能使类间散度和整体散度最大化、类内散度和域间散度最小化的特征变换矩阵。本发明专利技术的研究方法和取得的成果可进一步丰富脑电信号识别算法内容,具有广泛的应用价值。价值。价值。

【技术实现步骤摘要】
一种基于领域泛化的脑电度量迁移学习方法


[0001]本专利技术涉及一种基于领域泛化的脑电度量迁移学习方法,本专利技术属于脑机接口迁移学习领域,涉及脑电数据的整体散度、域间散度、类内散度、类间散度计算,最终根据计算得到的散度进行领域泛化性能的分析,从而得到泛化能力更强的模型。

技术介绍

[0002]脑机接口的核心是使得机器能够“读懂”大脑意图,所以首先需要用一种方式来记录、测量大脑的活动情况。在目前的研究中,脑电信号是一种较为有效的记录大脑活动的方式,大部分研究都希望在尽可能短的时间内检测和分析能够反映大脑不同状态的信号。
[0003]目前的检测技术主要包括脑电图(EEG)、脑皮层电图(ECoG)、脑磁图(EMG)、功能磁共振成像(fMRI)、正电子发射断层扫描(PET)等。其中EEG相对简单快速,价格便宜,不会对人体造成损伤,同时具有较高的时间分辨率,因此成为BCI最重要的信号获取手段之一。然而,在BCI系统实际应用中要获得充足而又能覆盖整个数据空间的代表性样本是非常困难的一项任务,因此在传统的模式识别与机器学习领域中,通常假设训练数据和测试数据来自同一特征空间,并且服从相同的数据分布。一方面,由于训练过程比较乏味,如果训练时间过长,给被试者带来很大的工作量及精神负担,在某些情况下对病患进行长时间训练甚至不可行,因此原始的带有标记的样本通常较少,不足以训练一个好的分类器;另一方面,EEG数据具有时变性,在不同采集时间、不同状态下采集的EEG数据呈现出较大的差异,这使得在不同个体、试次、任务中获取的数据分布存在较大的不一致性,机器学习模型参数的校准时间长、适应性弱。为此,如何减少被试的训练时间和提高准确率与适应性已成为BCI系统实用化过程中亟待解决的一个重要问题。
[0004]度量迁移学习是一种融合度量学习和迁移学习的新的研究领域,旨在找到一种合适的方法来揭示数据之间的关系。度量学习通常需要大量的标签信息才能获得满意的性能;而迁移学习中,虽然目标域无法提供足够的有标记样本进行训练,但是可以将其他有标记的数据加入到源域中进行训练,这就能使得迁移学习可以很好地满足度量学习的需求,实现类内距离最小化、类间距离最大化,能够更好地协助迁移学习提高分类器的性能。目前已经有研究将度量迁移学习用于脑电的识别,然而这些度量迁移学习方法没有明确地减少学习过程中不同的源域、目标域之间的差异,导致学习所得到的模型的泛化能力不足。在目标域数据分布变化较大时,迁移学习模型的分类性能不能达到较好的效果。
[0005]领域泛化(Domain Generalization,DG)是从若干个具有不同数据分布的数据集(领域)中学习一个泛化能力强的模型,以便在未知的测试集上取得优良的性能。目前主要的方法分为数据操作、学习策略(Learning Strategy)、表征学习(Representation Learning)。其中,基于表征学习的领域泛化方法受到广泛关注,已成功应用在计算机视觉、图像分析等领域。Blanchard等人首次将核方法用于领域泛化,采用半正定核学习方法,从训练数据中学习一个领域不变核。Erfani等人提出了一个椭圆概要随机化方法(Elliptical Summary Randomisation,ESRand),它由一个随机化的核和椭圆数据组成。
ESRand将每个域投影成一个椭圆来表示域信息,然后使用相似性度量来计算距离。Li等人提出了一种新的基于样本支持向量机的领域泛化和领域自适应方法,即在目标函数中引入了一个基于核范数的正则化器,以使样本支持向量机对训练样本产生低秩输出,增加目标域的领域适应性。Pan等人提出的迁移成分分析方法(Transfer Component Analysis,TCA)是数据分布自适应的经典迁移方法。与TCA的核心思想类似,域不变成分分析方法(Domain

Invariant Component Analysis,DICA)是使用核进行领域泛化的经典方法之一,其目标是找到一个特征变换核函数,使得特征空间中所有数据之间的分布差异最小化。Ghifary等人提出的分散成分分析方法(Scatter Component Analysis,SCA)使用核方法学习领域不变的表示,采用费希尔判别分析最小化来自同一类别和同一领域的表示的差异,并最大化来自不同类别和不同领域的表示的差异。Dissanayake等人提出的领域泛化方法使用一组已知的基域来表示一个不可见的领域,然后使用分类器融合对不可见的领域进行分类,在包含正常和异常声音的心音数据库上取得了较好的分类准确率。在BCI领域,研究者已经对脑电识别模型的泛化能力进行了初步研究,取得了一些研究成果。Han等人从领域泛化的角度探讨了在实际情况下BCI的零校准问题,结果表明显式领域泛化算法优于经验风险最小化方法。Ma等人提出了一个新的对抗性领域泛化框架DResNet,在该框架中,领域信息被用来学习权重的两个组成部分:被试之间常见的无偏权重和被试特定的有偏权重。该方法不需要来自测试对象的任何数据,能够同时很好地泛化到多个测试对象。Omedes等人探讨了利用低频特征提高ERP

BCI的泛化能力,并证明在频域中存在一个稳定的模式,允许分类器在任务之间泛化。Wu等人首次将主动学习运用于BCI的回归问题,并研究了BCI回归模型的泛化能力。

技术实现思路

[0006]本专利技术的目的是针对脑电度量迁移学习研究中如何提升迁移学习模型的泛化能力这一难点,提供一种基于领域泛化的脑电度量迁移学习方法。
[0007]面向脑机接口的迁移学习方法中,针对单个目标域分布特性进行迁移学习所得到的模型泛化能力较弱,尤其是在跨任务迁移学习中,巨大的数据分布差异往往导致迁移性能的大幅下降。为了解决脑机接口中迁移学习模型泛化能力弱的问题,本专利技术引入领域泛化来提升性能,达到模型一次训练、多次使用的目的。
[0008]为实现上述目的,本专利技术的技术方案是:
[0009]一种基于领域泛化的脑电度量迁移学习方法,包括以下步骤:
[0010]步骤一:计算脑电数据的整体散度。
[0011]具体为:
[0012]假设有n个源域源域数据X的分布在映射φ下的散度定义为:
[0013][0014]其中,||
·
||
H
是RKHS中的范数;μ
D
是在RKHS空间中的均值映射。
[0015]定义所有源域的域均值为:整体散度表示为通过
对所有原始数据进行映射,得到Φ=[φ(x1),...,φ(x
n
)]T
,减去均值后,就可以得到协方差矩阵:cov(Φ)=Φ
T
Φ,整体散度可以进一步表示为使用核方法,寻找特征变换矩阵P,整体散度在映射φ下的优化目标如下:
[0016][0017]s.t.P
T
KP=I
ꢀꢀꢀꢀꢀ
(2)
[0018]其中,Tr(P
T
KKP)表示矩阵P本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于领域泛化的脑电度量迁移学习方法,其特征在于:包括以下步骤:步骤一、求解脑电数据的整体散度;步骤二、度量不同域之间的相似性;步骤三、求解类内散度和类间散度。2.根据权利要求1所述的一种基于领域泛化的脑电度量迁移学习方法,其特征在于:所述步骤一具体包括:假设有n个源域源域数据X的分布在映射φ下的散度定义为:其中,||
·
||
H
是RKHS中的范数;μ
D
是在RKHS空间中的均值映射。定义所有源域的域均值为:整体散度表示为通过对所有原始数据进行映射,得到Φ=[φ(x1),...,φ(x
n
)]
T
,减去均值后,得到协方差矩阵:cov(Φ)=Φ
T
Φ,整体散度进一步表示为Φ,整体散度进一步表示为使用核方法,寻找特征变换矩阵P,整体散度在映射φ下的优化目标如下:s.t.P
T
KP=I
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,Tr(P
T
KKP)表示矩阵P
T
KKP的对角线元素之和。3.根据权利要求1所述的一种基于领域泛化的脑电度量迁移学习方法,其...

【专利技术属性】
技术研发人员:佘青山陈铁席旭刚张启忠汪婷
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1