基于谐波冲激增强频谱特征的鼾声分类方法及系统技术方案

技术编号:39739785 阅读:9 留言:0更新日期:2023-12-17 23:41
本发明专利技术涉及音频信号处理与技术领域,具体涉及一种基于谐波冲激增强频谱特征的鼾声分类方法及系统

【技术实现步骤摘要】
基于谐波冲激增强频谱特征的鼾声分类方法及系统


[0001]本专利技术涉及音频信号处理与
,具体涉及一种基于谐波冲激增强频谱特征的鼾声分类方法及系统,更具体地说,本专利技术涉及一种利用谐波冲激增强频谱特征和卷积神经网络对鼾声进行分类的方法及系统


技术介绍

[0002]阻塞性睡眠呼吸暂停
(obstructive sleep apnea,OSA)
是一种严重的睡眠障碍疾病,病症主要表现为患者在睡眠时上呼吸道频繁塌陷,导致呼吸气流反复停止或减少,在临床上表现为响亮打鼾

呼吸突然暂停和身体突然觉醒
。OSA
会导致低氧血症

高血压

中风

心力衰竭甚至猝死等严重后果

目前对
OSA
进行诊断需要患者在睡眠实验室与超过
15
个通道的测量设备进行连接并进行整夜的多导睡眠监测,并由专业的睡眠技师进行数据分析,整个过程十分昂贵且耗时

另外,中国仅有约
3000
家睡眠实验室,且集中在三甲医院,而中国的
OSA
患者已达到
1.76
亿,诊断率和治疗率均不足1%

因此,一种经济便捷的检测方式对于提高患者早期发现睡眠呼吸暂停疾病具有重要意义

[0003]打鼾是
OSA
患者的最显著症状,并且鼾声由上气道软组织振动产生,携带着上气道是否存在阻塞的结构信息

已经有研究人员发现
OSA
鼾声和正常鼾声在声学特征上存在差异,通过对此差异的研究可以进一步实现对鼾声的分类方法

并且此分类方法可以移植到智能手机等设备居家使用,有助于进行大规模的早期筛查
。OSA
疾病会严重影响人类的生活质量,而鼾声分类是对该疾病进行检测的重要依据,因此对鼾声进行分类具有重要意义

[0004]目前常用的对鼾声进行分类的方法主要包括两个步骤,一是提取鼾声声学特征,二是将特征输入模型进行鼾声分类

声学特征主要包括
800
赫兹功率比

基因周期

梅尔谱

关联维以及它们的均值

方差等统计参数

分类模型主要包括逻辑回归

支持向量机

深度神经网络等,其中卷积神经网络最为常用

比如:
[0005]公开号为
CN107358965A
的中国专利技术申请公开了一种睡眠鼾声分类检测方法及系统;该专利技术通过将鼾声与呼吸紊乱事件适时结合,以呼吸紊乱事件为中心,定义普通鼾声及呼吸紊乱事件相关鼾声,将整晚睡眠鼾声进行四分类,避免过多复杂的分类影响分类系统的识别效果,研究四类鼾声的特征差异,实现了四类鼾声
(
呼吸紊乱事件前后鼾声

呼吸暂停中鼾声

低通气中鼾声和普通鼾声
)
的自动分类

但该方法选择的特征较多,分析过程过于冗余复杂,效率低

[0006]公开号为
CN111789577A
的中国专利技术申请公共开了一种基于常数
Q
变换和短时傅里叶变换的深度语谱特征的鼾声分类方法

该方法通过对鼾声音频信号进行常数
Q
变换与短时傅里叶变换,将变换后生成的语谱图作为预训练深度卷积神经网络的输入,提取其输出作为特征向量,使用训练好的分类模型实现鼾声自动识别

常数
Q
变换和短时傅里叶变换的深度语谱特征也是常规声学处理信号的处理,对于鼾声的处理针对性并不强

[0007]因此,虽然现有技术对鼾声进行分类的方法取得了一定效果,但也存在一定的局限性

但是现有方法大都直接采用在其他音频任务中广泛使用的特征,并未考虑
OSA
鼾声产
生的医学过程和病理特性,导致这些特征在
OSA
检测任务上效果不佳,并且缺乏医学解释性


OSA
患者上气道塌陷并阻碍气流通过时,其呼吸被迫暂停,血氧饱和度逐渐下降,进而刺激中枢神经产生冲动,迫使肌肉收缩产生猛烈的呼吸动作

此时患者的上气道被冲开,气流快速通过产生响亮的鼾声

由于上气道由阻塞状态突然打开,
OSA
鼾声中包含大量的冲激成分

而良性鼾声产生时上气道相对通畅且结构稳定,包含更多的谐波成分

现有的声学特征尚未考虑到
OSA
和良性鼾声的不同产生过程以及它们在谐波和冲激成分上的差异


技术实现思路

[0008]本专利技术的目的在于设计一种基于谐波冲激增强频谱特征和卷积神经网络的鼾声分类方法,即采用谐波冲激分析和时频点自适应增强的方式,对
OSA
和良性鼾声频谱中的谐波和冲激结构进行增强,引导网络关注更加具有差异性和医学解释性的谐波和冲激部分,提升
OSA
和良性鼾声的分类准确率

[0009]为达到上述目的,本专利技术通过下述技术方案实现

[0010]本专利技术提出了一种基于谐波冲激增强频谱特征的鼾声分类方法,所述方法包括:
[0011]提取鼾声信号的梅尔频谱;将梅尔频谱分解为谐波频谱和冲激频谱;计算谐波频谱的频率权重和冲激频谱的时间权重,并分别进行加权得到谐波增强频谱和冲激增强频谱;将谐波增强频谱和冲激增强频谱以一定比例线性组合,得到谐波冲激增强频谱;
[0012]将谐波冲激增强频谱特征输入训练好的卷积神经网络,得到鼾声分类结果

[0013]作为上述技术方案的改进之一,所述卷积神经网络包括一个卷积层

多个残差块和一个融合输出块;其中,
[0014]所述卷积层用于对输入的谐波冲激增强频谱特征依次进行卷积

批标准化
、ReLU
激活函数和平均池化,并输出提取的特征;
[0015]每个残差块均依次包括:两个卷积层

挤压激活操作层和残差连接,用于对卷积层输出的特征再次进行深度提取;
[0016]所述融合输出块依次包括:卷积层

通道注意力机制

全局平均池化和全连接层,用于融合特征中不同通道之间的信息,并输出鼾声分类结果

[0017]作为上述技术方案的改进之一,所述方法还包括卷积神经网络的训练过程;训练过程包括如下步骤:
[0018]采集各种鼾声信号,并处理得到各鼾声信号的谐波冲激增强频谱;
[0019本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于谐波冲激增强频谱特征的鼾声分类方法,所述方法包括:提取鼾声信号的梅尔频谱;将梅尔频谱分解为谐波频谱和冲激频谱;计算谐波频谱的频率权重和冲激频谱的时间权重,并分别进行加权得到谐波增强频谱和冲激增强频谱;将谐波增强频谱和冲激增强频谱以一定比例线性组合,得到谐波冲激增强频谱;将谐波冲激增强频谱特征输入训练好的卷积神经网络,得到鼾声分类结果
。2.
根据权利要求1所述的基于谐波冲激增强频谱特征的鼾声分类方法,其特征在于,所述卷积神经网络包括一个卷积层

多个残差块和一个融合输出块;其中,所述卷积层用于对输入的谐波冲激增强频谱特征依次进行卷积

批标准化
、ReLU
激活函数和平均池化,并输出提取的特征;每个残差块均依次包括:两个卷积层

挤压激活操作层和残差连接,用于对卷积层输出的特征再次进行深度提取;所述融合输出块依次包括:卷积层

通道注意力机制

全局平均池化和全连接层,用于融合特征中不同通道之间的信息,并输出鼾声分类结果
。3.
根据权利要求2所述的基于谐波冲激增强频谱特征的鼾声分类方法,其特征在于,所述方法还包括卷积神经网络的训练过程;训练过程包括如下步骤:采集各种鼾声信号,并处理得到各鼾声信号的谐波冲激增强频谱;构建卷积神经网络;将各鼾声信号的谐波冲激增强频谱作为训练数据集输入到卷积神经网络中,对卷积神经网络进行训练,得到训练好的卷积神经网络
。4.
根据权利要求1‑3之一所述的基于谐波冲激增强频谱特征的鼾声分类方法,其特征在于,所述提取鼾声音频的二维梅尔频谱,包括:采用短时傅里叶变换将鼾声信号由时域转换到时频域,将线性频谱转换为梅尔频谱
。5.
根据权利要求1‑3之一所述的基于谐波冲激增强频谱特征的鼾声分类方法,其特征在于,采用谐波冲激分解算法将梅尔频谱分解为谐波频谱和冲激频谱
。6.
根据权利要求1‑3之一所述的基于谐波冲激增强频谱特征的鼾声分类方法,其特征在于,使用具有温度系数的
softmax
函数来获得谐波频谱的频率权重和冲激频谱的时间权重
。7.
根据权利要求6所述的基于谐波冲激增强频谱特征的鼾声分类方法,其特征在于,谐波频谱的频率权重
w
h
[k]
计算如下:其中,
E
h
[k]
为谐波频谱在频率
k
上的能量,
E
h
[k]


m
|H[m,k]|

H[m,k]...

【专利技术属性】
技术研发人员:张学帅胡澳林颜永红张鹏远
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1