当前位置: 首页 > 专利查询>清华大学专利>正文

一种用于睡眠分期的模型训练方法及装置制造方法及图纸

技术编号:26891497 阅读:33 留言:0更新日期:2020-12-29 16:09
本发明专利技术公开了一种用于睡眠分期的模型训练方法,方法包括:构建用于睡眠分期的单通道输入竞争学生模型和多通道输入教师模型;将多通道信号输入教师模型,并根据教师模型的输出获得教师模型损失,将单通道信号输入所述竞争学生模型,并根据竞争学生模型的输出获得竞争学生模型损失;根据教师模型中隐含层的输出和竞争学生模型中隐含层的输出确定知识迁移损失;根据竞争学生模型损失、教师模型损失和知识迁移损失对教师模型和竞争学生模型进行优化,直至满足停止条件;根据已训练教师模型和已训练竞争学生模型构建用于睡眠分期的单通道输入合作学生模型,并基于知识蒸馏技术对合作学生模型进行训练,最终得到精度得到改善的教师模型和合作学生模型。

【技术实现步骤摘要】
一种用于睡眠分期的模型训练方法及装置
本专利技术涉及睡眠分期
,具体涉及一种用于睡眠分期的模型训练方法及装置。
技术介绍
基于多通道的PSG(多导睡眠图)的应用领域之一便是睡眠分期,PSG信号包括脑电信号(EEG)、眼电信号(EOG)、肌电信号(EMG)以及心电信号(ECG)等。目前,常用的睡眠分期模型有基于多通道输入的序列对序列的SeqSleepNet和基于单通道输入的包括CNN和Bi-LSTM(双向上短期记忆网络)的DeepSleepNet。然而,SeqSleepNet需要输入多个通道的信号,限制了单通道的应用场景,因为实际测试时为了患者使用的方便性,一般使用的是单通道可穿戴脑电信号采集设备;DeepSleepNet只选择一个通道的信号输入,其他通道的信号均被丢弃,牺牲了模型的准确度。
技术实现思路
本专利技术的目的是针对上述现有技术的不足提出的一种用于睡眠分期的模型训练方法及装置,该目的是通过以下技术方案实现的。本专利技术的第一方面提出了一种用于睡眠分期的模型训练方法,所述方法包括:构建用本文档来自技高网...

【技术保护点】
1.一种用于睡眠分期的模型训练方法,其特征在于,所述方法包括:/n构建用于睡眠分期的单通道输入竞争学生模型和多通道输入教师模型;/n将多通道信号输入所述教师模型,并根据所述教师模型的输出获得教师模型损失,将所述多通道信号中的预设通道信号输入所述竞争学生模型,并根据所述竞争学生模型的输出获得竞争学生模型损失;根据所述教师模型中隐含层的输出和所述竞争学生模型中隐含层的输出确定知识迁移损失;根据所述竞争学生模型损失、所述教师模型损失和所述知识迁移损失对所述教师模型和所述竞争学生模型进行优化,直至满足停止条件;/n根据已训练教师模型和已训练竞争学生模型构建用于睡眠分期的单通道输入合作学生模型,并基于知...

【技术特征摘要】
1.一种用于睡眠分期的模型训练方法,其特征在于,所述方法包括:
构建用于睡眠分期的单通道输入竞争学生模型和多通道输入教师模型;
将多通道信号输入所述教师模型,并根据所述教师模型的输出获得教师模型损失,将所述多通道信号中的预设通道信号输入所述竞争学生模型,并根据所述竞争学生模型的输出获得竞争学生模型损失;根据所述教师模型中隐含层的输出和所述竞争学生模型中隐含层的输出确定知识迁移损失;根据所述竞争学生模型损失、所述教师模型损失和所述知识迁移损失对所述教师模型和所述竞争学生模型进行优化,直至满足停止条件;
根据已训练教师模型和已训练竞争学生模型构建用于睡眠分期的单通道输入合作学生模型,并基于知识蒸馏技术对所述合作学生模型进行训练,以将已训练教师模型的知识迁移到所述合作学生模型。


2.根据权利要求1所述的方法,其特征在于,所述教师模型包括针对每一输入通道的低层次CNN和针对各个低层次CNN的输出拼接后的高层次CNN,且每一输入通道的低层次CNN由分组卷积实现;
所述竞争学生模型包括针对单输入通道的低层次CNN和高层次CNN,所述单输入通道的低层次CNN共享所述教师模型中各个低层次CNN基于通道洗牌得到的参数。


3.根据权利要求2所述的方法,其特征在于,所述合作学生模型包括针对单输入通道的低层次CNN和高层次CNN;
根据已训练教师模型和已训练竞争学生模型构建用于睡眠分期的单通道输入合作学生模型,包括:
将已训练教师模型中针对所述预设通道的低层次CNN中的参数作为所述合作学生模型中针对单输入通道的低层次CNN的初始参数;
将已训练竞争学生模型中高层次CNN中的参数作为所述合作学生模型中高层次CNN的初始参数。


4.根据权利要求1所述的方法,其特征在于,根据所述竞争学生模型损失、所述教师模型损失和所述知识迁移损失对所述教师模型和所述竞争学生模型进行优化,包括:
在执行第一预设训练次数过程中,根据所述竞争学生模型损失、所述教师模型损失、所述知识迁移损失以及知识迁移损失的第一系数对所述教师模型和所述竞争学生模型进行优化;
在执行第二预设训练次数过程中,根据所述竞争学生模型损失、所述教师模型损失、所述知识迁移损失以及知识迁移损失的第二系数对所述教师模型和所述竞争学生模型进行优化;
其中,所述第一系数小于所述第二系数。


5.根据权利要求4所述的方法,其特征在于,基于知识蒸馏技术对所述合作学生模型进行训练,包括:
将多通道信号输入已训练教师模型,并根据已训练教师模型的输出获得教师模型损失,将所述多通道信号中的预设通道信号输入所述合作学生模型,并根据所述合作学生模型的输出获得合作学生模型损失;
根据所述已训练...

【专利技术属性】
技术研发人员:张沕琳廖一桥谢翔王志华
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1