基于持续学习的非线性医疗传感器数据的语义分割方法技术

技术编号:33745912 阅读:9 留言:0更新日期:2022-06-08 21:45
本发明专利技术提出一种基于持续学习的非线性医疗传感器数据的语义分割方法,包括:基于CNN构建语义分割模型;将心电信号样本数据集导入语义分割模型进行迭代训练;选取对于当前训练任务难度较低的实例定义为第一重要实例存放至缓冲区;将脑电信号样本数据集中导入语义分割模型再次进行训练;选取对于当前训练任务难度较低的实例定义为第二重要实例存放至缓冲区;采用缓冲区存储的重要实例对模型再次训练,保存准确率最高的模型作为最终应用的语义分割模型。本发明专利技术能够使计算机进行自动、高效、准确地对非线性的医疗传感器数据中的各个类别的数据进行精确定位和分类;并且使得模型具有一定的持续学习能力和迁移能力。定的持续学习能力和迁移能力。定的持续学习能力和迁移能力。

【技术实现步骤摘要】
Networks, 简称CNN)的非线性医疗传感器数据的语义分割方法,能够使计算机进行自动、高效、准确地对非线性的医疗传感器数据中的各个类别的数据进行精确定位和分类;并且使得模型具有一定的持续学习能力和迁移能力。
[0007]技术方案:一种基于持续学习的非线性医疗传感器数据的语义分割方法,所述语义分割方法包括以下步骤:S1,获取心电图数据集和脑电图数据集,对心电图数据集和脑电图数据集中的心电信号和脑电信号进行预处理,分别生成心电信号样本数据集和脑电信号样本数据集;S2,基于CNN构建语义分割模型,对语义分割模型进行初始化,设置损失函数和超参数;S3,将心电信号样本数据集导入语义分割模型进行迭代训练,定位心电信号中各心拍类型的位置和预测各心拍的类型;同时,基于重要实例的缓冲区机制,计算每个实例对于当前任务的训练难易度程度,选取对于当前训练任务难度较低的实例定义为第一重要实例存放至缓冲区;训练完成后,保存准确率最高的模型参数和相应的准确率;S4,将脑电信号样本数据集中导入步骤S3中已经完成心电信号样本训练的语义分割模型,再次进行训练,定位脑电信号中各睡眠状态的位置和预测各睡眠状态的类型;同时,基于重要实例的缓冲区机制,计算每个实例对于当前任务的训练难易度程度,选取对于当前训练任务难度较低的实例定义为第二重要实例存放至缓冲区;训练完成后,保存准确率最高的模型参数和相应的准确率;S5,采用缓冲区存储的第一重要实例和第二重要实例对步骤S4中得到的语义分割模型进行再次训练,保存准确率最高的模型作为最终应用的语义分割模型。
[0008]进一步地,步骤S1中,对心电图数据集和脑电图数据集中的心电信号和脑电信号进行预处理的过程包括以下步骤:S11,采用小波变换对心电信号数据集和脑电信号数据集进行去噪处理;S12,根据心电信号数据集中提供的标注信息,对每个心拍的位置和类型进行标注,生成心电信号样本数据集;根据脑电信号数据集中提供的标注信息,对每个睡眠状态的片段进行标注,生成脑电信号样本数据集;S13,对心电信号样本数据集和脑电信号样本数据集分别进行划分,得到相应的训练集和测试集。
[0009]进一步地,步骤S12中,根据心电信号数据集中提供的标注信息,对每个心拍的位置和类型进行标注,生成心电信号样本数据集的过程包括以下步骤:将心拍类型分为正常搏动、室上异位心拍、心室异位心拍、融合心拍以及不可分心拍;设置一个滑动窗口,基于R峰位置向前取100个采样点和向后取200个采样点进行心拍截取,使每个心拍对应300个采样点;标注每个心拍对应的类型,得到心电信号样本;进一步地,步骤S12中,根据脑电信号数据集中提供的标注信息,对每个睡眠状态的片段进行标注,生成脑电信号样本数据集的过程包括以下步骤:将睡眠状态分为清醒(W)、困倦(S1)、浅睡眠(S2)、深度睡眠(S3)、快速眼动(REM)
五个阶段;获取脑电信号数据集中每个睡眠状态的起始位置和睡眠类型,针对每个睡眠状态,截取300个采样点,标注睡眠状态的类型。
[0010]进一步地,步骤S2中,所述语义分割模型包括依次连接的18个卷积层、3个最大池化层、3个Dropout层和3个Concatenate操作层;模型训练的基本损失函数使用交叉熵损失函数:式中,N表示实例总数,K表示类别的个数, 表示第个实例属于第个类别的可能性,若第个实例属于第个类别则,否则;关于超参数的设置具体如下:模型输入的数据长度设置为3600 个采样点,步长大小设置为2,激活函数均使用ReLU激活函数,优化器使用Adam优化器,样本训练批次数设置为125,迭代次数设置为35。
[0011]进一步地,步骤S3中,将心电信号样本数据集导入语义分割模型进行迭代训练的过程包括以下步骤:S31,对心电信号的每一类心拍类型进行One

Hot编码,将正常搏动、室上异位心拍、心室异位心拍、融合心拍以及不可分心拍这五类心拍类型进行编码后所对应的类别标签分别定义为:0,1、2、3和4;S32,从心电信号样本数据集的训练集中提取部分样本数据组成验证集;S33,在每一次迭代训练中,利用公式(1)计算当前任务的第个心电信号实例对于当前任务的第i个心电信号损失,记为;采用公式(2)计算得到每个训练批次下的损失函数:式中,是指超参数样本训练批次数;用来衡量心电信号实例训练的困难程度,最大表示该心电信号实例越容易训练;在训练初始时,每个心电信号实例初始化,使每个心电信号实例的训练难易程度在同一平面,随着训练过程进行,通过计算心电信号实例对于模型的损失程度来对进行梯度更新,计算如下:其中,是超参数,设置为0.3;是偏导数的表示符号;
损失函数中添加有正则项,计算如下:其中,是超参数,设置为0.1;在每一次迭代训练的过程中,获取对于当前任务模型准确最高的模型参数;同时记录每个心电信号实例对于当前任务的训练难易程度,利用基于重要实例的缓冲区机制,将重要实例存放入缓冲区中;当模型训练完成后,计算每个心电信号实例最后对于当前任务的训练难易程度,计算如下:其中,是指超参数迭代次数;S34,训练完成后,利用基于重要实例的缓冲区机制,计算每个心电信号实例的重要性,对进行从大到小排序,选取前48个作为当前任务对应的第一重要实例存放至缓冲区;同时,保存准确率最高的模型参数和准确率。
[0012]进一步地,步骤S4中,将脑电信号样本数据集中导入语义分割模型进行训练的过程包括以下步骤:S41,对脑电信号的每一类睡眠状态类型进行One

Hot编码,将清醒(W)、困倦(S1),浅睡眠(S2),深度睡眠(S3),快速眼动(REM)这五类睡眠状态进行编码后所对应的类别标签分别定义为:0,1、2、3和4;S42,从脑电信号样本数据集的训练集中提取部分样本数据组成验证集;S43,将脑电信号训练集的数据输入到步骤S3中已训练完的语义分割模型中进行训练,训练过程中,利用公式(1)计算当前任务的第个实例的损失,记为;计算缓冲区中上一次任务存放的重要实例对于当前第j个实例的损失,计算方式如下:其中,表示缓冲区中上一个任务对应的重要实例的个数, 表示缓冲区中上一个任务的重要实例对于当前任务的损失;根据公式(7)计算得到当前第j个实例任务的损失:根据公式(7)计算得到当前第j个实例任务的损失:
式中,是指超参数样本训练批次数;用来衡量脑电信号实例训练的困难程度,最大表示该脑电信号实例越容易训练;是超参数,设置为0.1;在每一次迭代训练的过程中,获取对于当前任务模型准确最高的模型参数;同时记录每个脑电信号实例对于当前任务的训练难易程度,利用基于重要实例的缓冲区机制,将重要实例存放入缓冲区中;当模型训练完成后,计算每个脑电信号实例最后对于当前任务的训练难易程度,计算如下:其中,是指超参数迭代次数;S44,训练完成后,利用基于重要实例的缓冲区机制,计算每个脑电信号实例的重要性,对进行从大到小排序,选取前48个作为当前任务对应的第二重要实例存放至缓冲区;同时,保存准确率最高的模型参数和准确率。
[0013]进一步地,步骤S5中,将心电信号的测试集和脑电信号的测试集输入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于持续学习的非线性医疗传感器数据的语义分割方法,其特征在于,所述语义分割方法包括以下步骤:S1,获取心电图数据集和脑电图数据集,对心电图数据集和脑电图数据集中的心电信号和脑电信号进行预处理,分别生成心电信号样本数据集和脑电信号样本数据集;S2,基于CNN构建语义分割模型,对语义分割模型进行初始化,设置损失函数和超参数;S3,将心电信号样本数据集导入语义分割模型进行迭代训练,定位心电信号中各心拍类型的位置和预测各心拍的类型;同时,基于重要实例的缓冲区机制,计算每个实例对于当前任务的训练难易度程度,选取对于当前训练任务难度较低的实例定义为第一重要实例存放至缓冲区;训练完成后,保存准确率最高的模型参数和相应的准确率;S4,将脑电信号样本数据集中导入步骤S3中已经完成心电信号样本训练的语义分割模型,再次进行训练,定位脑电信号中各睡眠状态的位置和预测各睡眠状态的类型;同时,基于重要实例的缓冲区机制,计算每个实例对于当前任务的训练难易度程度,选取对于当前训练任务难度较低的实例定义为第二重要实例存放至缓冲区;训练完成后,保存准确率最高的模型参数和相应的准确率;S5,采用缓冲区存储的第一重要实例和第二重要实例对步骤S4中得到的语义分割模型进行再次训练,保存准确率最高的模型作为最终应用的语义分割模型。2.根据权利要求1所述的基于持续学习的非线性医疗传感器数据的语义分割方法,其特征在于,步骤S1中,对心电图数据集和脑电图数据集中的心电信号和脑电信号进行预处理的过程包括以下步骤:S11,采用小波变换对心电信号数据集和脑电信号数据集进行去噪处理;S12,根据心电信号数据集中提供的标注信息,对每个心拍的位置和类型进行标注,生成心电信号样本数据集;根据脑电信号数据集中提供的标注信息,对每个睡眠状态的片段进行标注,生成脑电信号样本数据集;S13,对心电信号样本数据集和脑电信号样本数据集分别进行划分,得到相应的训练集和测试集。3.根据权利要求2所述的基于持续学习的非线性医疗传感器数据的语义分割方法,其特征在于,步骤S12中,根据心电信号数据集中提供的标注信息,对每个心拍的位置和类型进行标注,生成心电信号样本数据集的过程包括以下步骤:将心拍类型分为正常搏动、室上异位心拍、心室异位心拍、融合心拍以及不可分心拍;设置一个滑动窗口,基于R峰位置向前取100个采样点和向后取200个采样点进行心拍截取,使每个心拍对应300个采样点;标注每个心拍对应的类型,得到心电信号样本。4.根据权利要求2所述的基于持续学习的非线性医疗传感器数据的语义分割方法,其特征在于,步骤S12中,根据脑电信号数据集中提供的标注信息,对每个睡眠状态的片段进行标注,生成脑电信号样本数据集的过程包括以下步骤:将睡眠状态分为清醒、困倦、浅睡眠、深度睡眠和快速眼动五个阶段;获取脑电信号数据集中每个睡眠状态的起始位置和睡眠类型,针对每个睡眠状态,截取300个采样点,标注睡眠状态的类型。5.根据权利要求1所述的基于持续学习的非线性医疗传感器数据的语义分割方法,其
特征在于,步骤S2中,所述语义分割模型包括依次连接的18个卷积层、3个最大池化层、3个Dropout层和3个Concatenate操作层;模型训练的基本损失函数使用交叉熵损失函数:式中,N表示实例总数,K表示类别的个数, 表示第个实例属于第个类别的可能性,若第个实例属于第个类别则,否则;关于超参数的设置具体如下:模型输入的数据长度设置为3600 个采样点,步长大小设置为2,激活函数均使用ReLU激活函数,优化器使用Adam优化器,样本训练批次数设置为125,迭代次数设置为35。6.根据权利要求5所述的基于持续学习的非线性医疗传感器数...

【专利技术属性】
技术研发人员:孙乐徐天博
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1