基于非语言音频特征识别的夜磨牙实时诊断方法和系统技术方案

技术编号：37979052 阅读：15 留言：0更新日期：2023-06-30 09:54

本发明专利技术属于计算机辅助诊断技术领域，具体为一种基于非语言音频特征识别的夜磨牙实时诊断方法和系统。本发明专利技术包括在睡眠状态的环境下采集音频；将音频通过分帧方法，将非平稳信号转化为短时平稳信号；对音频样本进行多种时域特征和多种频域特征的提取，并结合每个不同帧的多种特征数组总结出方差分布和均值分布的特征组；通过机器学习模型优选夜磨牙诊断最佳预测模型。本发明专利技术能在复杂睡眠环境中高准确率的识别磨牙的发生及其他睡眠状态的发生，无需用更多的计算资源去对音频信号进行去噪滤波等预处理，能以简单的流程实现对夜磨牙无接触监测诊断，可避免患者感觉不舒适性的同时，为后续夜磨牙症的实施干预提供实用参考和理论分析依据。论分析依据。论分析依据。

全部详细技术资料下载

【技术实现步骤摘要】
基于非语言音频特征识别的夜磨牙实时诊断方法和系统

[0001]本专利技术属于计算机辅助诊断
，具体涉及一种基于非语言音频特征识别的夜磨牙实时诊断方法和系统。

技术介绍

[0002]根据2018年关于评估磨牙症的国际共识定义，夜磨牙是人体睡眠过程中咀嚼肌有节律(阶段性)或无节律(强直性)的活动，在健康的个体中不是运动障碍和睡眠障碍，但是会增加其他疾病的风险，如牙齿磨损，咀嚼肌肥大、颞颌关节功能紊乱、脸部肌肉酸痛、甚至会导致头痛等。根据可靠文献调研，人群中患夜磨牙症群体分布广泛，在青少年中就占有8％的比例。为减少夜磨牙症对他人和自身的负面影响，实现对夜磨牙症的正确诊断和处理，对生活和健康具有着重要的意义。
[0003]目前针对磨牙症的诊断方式主要是：问卷调查、临床评估、和便携式设备诊断。其问卷调查和临床评估对于磨牙症的诊断特异性过低，而且是针对磨牙症损害已经造成的情况之后的评估，并不能阻止磨牙症的发生；其基于表面肌电信号SEMG的便携性设备被广泛研究，基于肌电对磨牙症的实时诊断和磨牙症的磨牙程度检测都在一定的范围内...

【技术保护点】

【技术特征摘要】
1.一种基于非语言音频特征识别的夜磨牙实时诊断方法，其特征在于，具体步骤为：步骤S1,音频采集：使用音频采集模块在睡眠环境下采集音频数据；步骤S2，分帧与降采样：将采集到的音频数据通过时间域上的分帧方法，将非平稳音频信号转化为短时平稳音频信号，且降低一半的采样频率；步骤S3，特征提取：对分帧之后的音频样本提取时域特征和频域特征，以及时频域特征；步骤S4，特征组归结：根据每个不同帧的多种特征数组，总结出多种时域方差分布和均值分布的特征组，以及多种频域方差分布和均值分布的特征组；步骤S5，机器学习模型选优：基于上述时域、频域、时频域的特征组，输入多个机器学习模型，选择夜磨牙预测最优模型，用于对夜磨牙的诊断评估。2.根据权利要求1所述的夜磨牙实时诊断方法，其特征在于，步骤S1中所述使用音频采集模块在睡眠环境下采集频的数据，是指自然睡眠环境中，通过麦克风采集睡眠环境中的声音，将麦克风固定于床中央区域，距离夜磨牙患者头部垂直上方30
‑
50cm处，获得音频数据的采样频率为44100HZ的单通道数据，采样位数为16位，音频格式为WAV的无损音频格式，且单次捕捉的音频数据样本长度为1s。3.根据权利要求2所述的夜磨牙实时诊断方法，其特征在于，步骤S2中，所述将采集到的音频数据通过时间域上的分帧方法，将非平稳音频信号转化为短时平稳音频信号，且降低一半的采样频率；具体包括：将采集到的音频数据进行降采样；通过时间域上的分帧方法，将非平稳音频信号转化为短时平稳音频信号，采样的一帧数据量为1024个点,每次分帧的移动是512个点步长。4.根据权利要求3所述的夜磨牙实时诊断方法，其特征在于，步骤S3中所述对分帧之后的音频样本提取时域特征和频域特征，以及时频域特征，包含以下子步骤：步骤S3
‑
1，提取时域特征，其时域特征为AE、EMS、ZCR，具体计算方式如下：AE计算式为:EMS计算式为:ZCR计算式为:式中，s(k)表示语音信号，k是语音信号采样点数的坐标，K代表一帧语音信号的采样点数，t表示第t帧的语音信号；即tk代表第t帧的首个采样点的位置，(t+1)*k
‑
1代表第t帧的末尾采样点的位置，sgn为符号函数；步骤S3
‑
2，提取频域特征，频域特征为BER、SC、BW、SR，其计算方式如下：BER计算式为:
SC计算式为:BW计算式为:SR计算式为:上述式中，t表示第t帧的语音信号，m
t
(n)代表第t帧的信号，n为第n个采样点，F代表频带比中选取的分隔频率,N表示每一帧的采样点数，f
c
代表满足不等式的频谱点，m
i
代表能量；在频域特征上，补充谐波与感知(Harmonics and perception)特征，其计算式为:H(t)＝A*sin(2*pi*f*t+phi)，
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)S＝K*(10
L/10
)，
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)其中，H(t)是谐波的幅度函数，表示谐波在时间t处的幅度；A是谐波的振幅，表示谐波的最大幅度；f是谐波的频率，单位是赫兹；t是时间，单位是秒；phi是谐波的相位，表示谐波相对于基频的相位差；S是声压级，L是声强度级，K是常数；步骤S3
‑
3，提取时频域特征，即梅尔倒谱系数MFCC；对S2步骤中的每一帧进行FFT变换，求出频谱，进而得到幅度谱，对幅度谱加上Mel滤波器组，对滤波器组输出做对数运算，最后进一步做离散余弦变换DCT，得MFCC，表达式如下：其中，i为第i个MFCC系数，N为每一帧的采样点数，l为第l个滤波器...

【专利技术属性】
技术研发人员：周伟，刘骁，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人