鼾声检测方法、装置、设备及存储介质制造方法及图纸

技术编号:17707403 阅读:30 留言:0更新日期:2018-04-14 19:37
本发明专利技术实施例公开了一种鼾声检测方法、装置、设备及存储介质。该鼾声检测方法包括:获取与目标音频数据对应的目标矩阵,并将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果;所述目标矩阵基于所述目标音频数据的梅尔频率倒频系数MFCC获取;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。采用本发明专利技术实施例,可用于更加简单,准确地实现鼾声检测,提高装置的效率。

【技术实现步骤摘要】
鼾声检测方法、装置、设备及存储介质
本专利技术涉及音频信号处理
,尤其涉及一种鼾声检测方法、装置、设备及存储介质。
技术介绍
打鼾是人们在日常生活中经常会遇到的一种睡眠障碍,患者熟睡后鼾声响度增大超过60dB以上,妨碍正常呼吸时的气体交换,称鼾症,5%的鼾症患者兼有睡眠期间不同程度憋气现象,称阻塞性睡眠呼吸暂停综合征(obstructivesleepapnea-hypopneasyndrome,OSAHS)。打鼾者的气道通常比正常人狭窄,白天清醒时咽喉部肌肉代偿性收缩使气道保持开放,不发生堵塞;但夜间睡眠时神经兴奋性下降,肌肉松弛,咽部组织堵塞,使上气道塌陷,当气流通过狭窄部位时,产生涡流并引起振动,从而出现鼾声。大多数人认为打鼾不会对健康造成影响,然而长期打鼾或是打鼾严重的人往往都伴有睡眠呼吸暂停综合征:在睡眠的全过程中出现呼吸暂停,血中氧气减少,形成一个短时间的缺氧状态。打鼾者血液和大脑长期供氧不足时,可能会诱发一些慢性疾病例如:高血压、心肌梗死、心绞痛及脑血管意外等,严重时如果夜间呼吸暂停时间超过120秒可能会导致猝死。目前诊断和评估鼾声主要是使用多导睡眠仪(Polysomnography,PSG),通过记录睡眠过程中的脑波、肌电图、心电图、口鼻腔气流、胸部腹部呼吸运动、声音等多种信号,综合分析被测者的睡眠状况和鼾症的严重程度。但是它要求在专业场所由专业人员进行操作,监控过程采取捆扎等方式附着于监控对象面部、鼻腔及胸腹部,对监控对象干扰大,且监控成本高。另一种适用于家庭治疗的装置,利用鼾声的周期性和呼吸运动的关系,但是对于复杂环境下的时有时无的鼾声判断准确度低下。因此,如何使得鼾声检测变得方便简单,且准确性高变得尤其重要。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种鼾声检测方法、装置、设备及存储介质;用于更加简单,准确地实现鼾声检测,提高装置的效率。第一方面,本专利技术实施例提供了一种鼾声检测方法,包括:获取与目标音频数据对应的目标矩阵,并将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果;所述目标矩阵基于所述目标音频数据的梅尔频率倒频系数MFCC获取;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。在一个可选的实现方式中,所述获取与目标音频数据对应的目标矩阵之前,所述方法还包括:获取原始音频数据后,确定所述目标音频数据,所述目标音频数据为与所述原始音频数据对应的有效音频数据。在一个可选的实现方式中,所述确定所述目标音频数据包括:利用语音端点检测方法VAD检测所述原始音频数据中的有效音频数据,得到所述目标音频数据。在一个可选的实现方式中,所述获取与目标音频数据对应的目标矩阵包括:计算所述目标音频数据的MFCC,得到X*Y系数矩阵,其中,X为目标音频数据的帧数,Y为MFCC系数长度;将所述X*Y系数矩阵中各信号帧的MFCC依次首尾相连得到长度为X*Y的第一一维矩阵;按预设步长从所述第一一维矩阵头部到所述第一一维矩阵尾部对所述第一一维矩阵进行分割,获得包括一组长度均为预设长度的第二一维矩阵的目标矩阵,每个所述第二一维矩阵具有相同的标签,所述预设步长为每帧MFCC长度的整数倍,所述预设长度为所述每帧MFCC长度的整数倍。在一个可选的实现方式中,所述目标音频数据的周期满足预设周期包括:所述目标音频数据的时域周期满足预设时域周期,和/或,所述目标音频数据的频域周期满足预设频域周期。在一个可选的实现方式中,所述目标音频数据的持续时间大于预设时间。在一个可选的实现方式中,所述目标矩阵携带有目标权重,在所述目标矩阵的数量为M时,所述M为大于1的整数,所述目标矩阵离所述目标音频数据的时域中心的距离越近,所述目标权重越高;所述将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果包括:将所述目标矩阵输入所述目标DNN模型,得到M个预测结果,依据所述M个预测结果以及所述目标权重确定所述判别结果。在一个可选的实现方式中,所述将所述目标矩阵输入目标深度神经网络DNN模型中之前,所述方法还包括:获取所述目标DNN模型。在一个可选的实现方式中,所述获取所述目标DNN模型包括:获取音频数据样本;计算所述音频数据样本的MFCC,得到N*L系数矩阵,其中,N为所述音频数据样本的帧数,L为MFCC系数长度;将所述N*L系数矩阵中各信号帧的MFCC依次首尾相连得到长度为N*L的第三一维矩阵;按预设步长从所述第三一维矩阵头部到所述第三一维矩阵尾部对所述第三一维矩阵进行分割,获得包括一组长度均为预设长度的第四一维矩阵的训练矩阵,每个所述第四一维矩阵具有相同的标签,所述预设步长为每帧MFCC长度的整数倍,所述预设长度为所述每帧MFCC长度的整数倍;利用所述训练矩阵训练DNN模型,得到所述目标DNN模型。第二方面,本专利技术实施例提供了一种鼾声检测装置,包括:第一获取单元,用于获取与目标音频数据对应的目标矩阵,所述目标矩阵基于所述目标音频数据的梅尔频率倒频系数MFCC获取;输入获得单元,用于将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果;确定单元,用于在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。在一个可选的实现方式中,所述第一获取单元,还用于获取原始音频数据;所述确定单元,还用于确定所述目标音频数据,所述目标音频数据为与所述原始音频数据对应的有效音频数据。在一个可选的实现方式中,所述确定单元,具体用于利用语音端点检测方法VAD检测所述原始音频数据中的有效音频数据,得到所述目标音频数据。在一个可选的实现方式中,所述第一获取单元包括:第一计算子单元,用于计算所述目标音频数据的MFCC,得到X*Y系数矩阵,其中,X为目标音频数据的帧数,Y为MFCC系数长度;第一处理子单元,用于将所述X*Y系数矩阵中各信号帧的MFCC依次首尾相连得到长度为X*Y的第一一维矩阵;第一分割子单元,用于按预设步长从所述第一一维矩阵头部到所述第一一维矩阵尾部对所述第一一维矩阵进行分割,获得包括一组长度均为预设长度的第二一维矩阵的目标矩阵,每个所述第二一维矩阵具有相同的标签,所述预设步长为每帧MFCC长度的整数倍,所述预设长度为所述每帧MFCC长度的整数倍。在一个可选的实现方式中,所述目标音频数据的周期满足预设周期包括:所述目标音频数据的时域周期满足预设时域周期,和/或,所述目标音频数据的频域周期满足预设频域周期。在一个可选的实现方式中,所述目标音频数据的持续时间大于预设时间。在一个可选的实现方式中,所述目标矩阵携带有目标权重,在所述目标矩阵的数量为M时,所述M为大于1的整数,所述目标矩阵离所述目标音频数据的时域中心的距离越近,所述目标权重越高;所述输入获得单元,具体用于将所述目标矩阵输入所述目标DNN模型,得到M个预测结果,依据所述M个预测结果以及所述目标权重确定所述判别结果。在一个可选的实现方式中,所述装置还包括:第二获取单元,用于获取所述目标DNN模型。在一个可选的实现方式中,所述第二获取单元包括:获取子单元,用于获取音频数据样本;第二计算子单元,用于计算所述音频数据样本的MFCC,得到N*L系数矩阵,其中,N本文档来自技高网
...
鼾声检测方法、装置、设备及存储介质

【技术保护点】
一种鼾声检测方法,其特征在于,包括:获取与目标音频数据对应的目标矩阵,并将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果;所述目标矩阵基于所述目标音频数据的梅尔频率倒频系数MFCC获取;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。

【技术特征摘要】
1.一种鼾声检测方法,其特征在于,包括:获取与目标音频数据对应的目标矩阵,并将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果;所述目标矩阵基于所述目标音频数据的梅尔频率倒频系数MFCC获取;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。2.根据权利要求1所述的方法,其特征在于,所述获取与目标音频数据对应的目标矩阵包括:计算所述目标音频数据的MFCC,得到X*Y系数矩阵,其中,X为目标音频数据的帧数,Y为MFCC系数长度;将所述X*Y系数矩阵中各信号帧的MFCC依次首尾相连得到长度为X*Y的第一一维矩阵;按预设步长从所述第一一维矩阵头部到所述第一一维矩阵尾部对所述第一一维矩阵进行分割,获得包括一组长度均为预设长度的第二一维矩阵的目标矩阵,每个所述第二一维矩阵具有相同的标签,所述预设步长为每帧MFCC长度的整数倍,所述预设长度为所述每帧MFCC长度的整数倍。3.根据权利要求1或2所述的方法,其特征在于,所述目标音频数据的周期满足预设周期包括:所述目标音频数据的时域周期满足预设时域周期,和/或,所述目标音频数据的频域周期满足预设频域周期。4.根据权利要求3所述的方法,其特征在于,所述目标矩阵携带有目标权重,在所述目标矩阵的数量为M时,所述目标矩阵离所述目标音频数据的时域中心的距离越近,所述目标权重越高,所述M为大于1的整数;所述将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果包括:将所述目标矩阵输入所述目标DNN模型,得到M个预测结果,依据所述M个预测结果以及所述目标权重确定所述判别结果。5.根据权利要求1所述的方法,其特征在于,所述将所述目标矩阵输入目标深度神经网络DNN模型中之前,所述方法还包括:获取所述目标DNN模型。6.根据权利要求5所述的方法,其特征在于,所述获取所述目标DNN模型包括:获取音频数据样本;计算所述音频数据样本的MFCC,得到N*L系数矩阵,其中,N为所述音频数据样本的帧数,L为MFCC系数长度;将所述N*L系数矩阵中各信号帧的MFCC依次首尾相连得到长度为N*L的第三一维矩阵;按预设步长从所述第三一维矩阵头部到所述第三一维矩阵尾部对所述第三一维矩阵进行分割,获得包括一组长度均为预设长度的第四一维矩阵的训练矩阵,每个所述第四一维矩阵具有相同的标签,所述预设步长为每帧MFCC长度的整数倍,所述预设长度为所述每帧MFCC长度的整数倍;利用所述训练矩阵训练DNN模型,得到所述目标DNN模型。7.一种鼾声检测装置,其特征在于,包括:第一获取单元,用于获取与目标音频数据对应的目标矩阵,所述目标矩阵为基于所述目标音频数据的梅尔频率倒频系数MFCC获取;输入获得单元,用于将所述目标矩阵输入目标深度神经网络DNN模型中,获得判别结果;确定单元,用于在所述目标音频数据的周期满足预...

【专利技术属性】
技术研发人员:冯澍婷刘洪涛王伟
申请(专利权)人:深圳和而泰智能控制股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1