鼾声检测方法、装置、设备及介质制造方法及图纸

技术编号:17688723 阅读:33 留言:0更新日期:2018-04-14 04:04
本发明专利技术实施例公开了一种鼾声检测方法、装置、设备及介质。该鼾声检测方法包括:获取与目标音频数据对应的目标特征向量,并将所述目标特征向量输入支持向量数据描述算法SVDD模型中,获得判别结果;所述目标特征向量为对所述目标音频数据的梅尔频率倒频系数MFCC经过特征提取后获得的特征向量;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。采用本发明专利技术实施例,可用于更加简单,准确地实现鼾声检测,提高装置的效率。

Snoring detection methods, devices, equipment and media

An embodiment of the invention discloses a method for detecting snoring, a device, a device and a medium. Including the snore detection method: obtaining target feature vector corresponding to the target audio data, and the target vectors of support vector data description algorithm SVDD model, discriminant results; the target feature vector as the feature vector of Mel frequency on the target audio data frequency coefficient MFCC obtained after feature extraction in the period; the target audio data to meet the preset period, and the discrimination result accords with the preset results, determine the target audio data for snoring. The application of the invention can be used to detect the snoring sound more easily and accurately, and improve the efficiency of the device.

【技术实现步骤摘要】
鼾声检测方法、装置、设备及介质
本专利技术涉及音频信号处理
,尤其涉及一种鼾声检测方法及装置。
技术介绍
打鼾是人们在日常生活中经常会遇到的一种睡眠障碍,患者熟睡后鼾声响度增大超过60dB以上,妨碍正常呼吸时的气体交换,称鼾症,5%的鼾症患者兼有睡眠期间不同程度憋气现象,称阻塞性睡眠呼吸暂停综合征(obstructivesleepapnea-hypopneasyndrome,OSAHS)。打鼾者的气道通常比正常人狭窄,白天清醒时咽喉部肌肉代偿性收缩使气道保持开放,不发生堵塞;但夜间睡眠时神经兴奋性下降,肌肉松弛,咽部组织堵塞,使上气道塌陷,当气流通过狭窄部位时,产生涡流并引起振动,从而出现鼾声。大多数人认为打鼾不会对健康造成影响,然而长期打鼾或是打鼾严重的人往往都伴有睡眠呼吸暂停综合征:在睡眠的全过程中出现呼吸暂停,血中氧气减少,形成一个短时间的缺氧状态。打鼾者血液和大脑长期供氧不足时,可能会诱发一些慢性疾病例如:高血压、心肌梗死、心绞痛及脑血管意外等,严重时如果夜间呼吸暂停时间超过120秒可能会导致猝死。目前诊断和评估鼾声主要是使用多导睡眠仪(Polysomnography,PSG),通过记录睡眠过程中的脑波、肌电图、心电图、口鼻腔气流、胸部腹部呼吸运动、声音等多种信号,综合分析被测者的睡眠状况和鼾症的严重程度。但是它要求在专业场所由专业人员进行操作,监控过程采取捆扎等方式附着于监控对象面部、鼻腔及胸腹部,对监控对象干扰大,且监控成本高。另一种适用于家庭治疗的装置,利用鼾声的周期性和呼吸运动的关系,但是对于复杂环境下的时有时无的鼾声判断准确度低下。因此,如何使得鼾声检测变得方便简单,且准确性高变得尤其重要。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种鼾声检测方法、装置、设备及介质;用于更加简单,准确地实现鼾声检测,提高装置的效率。第一方面,本专利技术实施例提供了一种鼾声检测方法,包括:获取与目标音频数据对应的目标特征向量,并将所述目标特征向量输入支持向量数据描述算法SVDD模型中,获得判别结果;所述目标特征向量为对所述目标音频数据的梅尔频率倒频系数MFCC经过特征提取后获得的特征向量;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。在一个可选的实现方式中,所述获取与目标音频数据对应的目标特征向量之前,所述方法还包括:获取原始音频数据后,确定所述目标音频数据,所述目标音频数据为与所述原始音频数据对应的有效音频数据。在一个可选的实现方式中,所述确定所述目标音频数据包括:利用语音端点检测方法VAD检测所述原始音频数据中的有效音频数据,得到所述目标音频数据。在一个可选的实现方式中,所述在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,所述方法还包括:保存所述原始音频数据。在一个可选的实现方式中,所述获取与目标音频数据对应的目标特征向量包括:计算所述目标音频数据的MFCC,得到X*Y系数矩阵,其中,X为目标音频数据的帧数,Y为MFCC系数长度;利用奇异值分解SVD方法分解所述X*Y系数矩阵,获得第一目标矩阵;对所述第一目标矩阵进行降维处理后,得到所述目标特征向量,所述目标特征向量中包含所述目标音频数据的整体趋势特征。在一个可选的实现方式中,所述目标音频数据的周期满足预设周期包括:所述目标音频数据的时域周期满足预设时域周期,和/或,所述目标音频数据的频域周期满足预设频域周期。在一个可选的实现方式中,所述目标音频数据的持续时间大于预设时间。在一个可选的实现方式中,所述将所述目标音频数据输入支持向量数据描述算法SVDD模型之前,所述方法还包括:获取所述SVDD模型。在一个可选的实现方式中,所述获取所述SVDD模型包括:获取音频数据样本并计算所述音频数据样本的MFCC,得到N*L系数矩阵,其中,N为所述音频数据样本的帧数,L为MFCC系数长度;利用奇异值分解SVD方法分解所述N*L系数矩阵,获得第二目标矩阵;对所述第二目标矩阵进行降维处理后,获得预设数目的特征向量,利用SVDD算法训练所述预设数目的特征向量,得到所述SVDD模型,所述预设数目的特征向量中包含所述音频数据样本的整体趋势特征。第二方面,本专利技术实施例提供了鼾声检测装置,包括:第一获取单元,用于获取与目标音频数据对应的目标特征向量;输入获得单元,用于将所述目标特征向量输入支持向量数据描述算法SVDD模型中,获得判别结果,所述目标特征向量为对所述目标音频数据的梅尔频率倒频系数MFCC经过特征提取后获得的特征向量;确定单元,用于在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。在一个可选的实现方式中,所述第一获取单元,还用于获取原始音频数据;所述确定单元,还用于确定所述目标音频数据,所述目标音频数据为与所述原始音频数据对应的有效音频数据。在一个可选的实现方式中,所述确定单元,具体用于利用语音端点检测方法VAD检测所述原始音频数据中的有效音频数据,得到所述目标音频数据。在一个可选的实现方式中,所述第一获取单元包括:第一计算子单元,用于计算所述目标音频数据的MFCC,得到X*Y系数矩阵,其中,X为目标音频数据的帧数,Y为MFCC系数长度;第一分解子单元,用于利用奇异值分解SVD方法分解所述X*Y系数矩阵,获得第一目标矩阵;第一降维处理子单元,用于对所述第一目标矩阵进行降维处理后,得到所述目标特征向量,所述目标特征向量中包含所述目标音频数据的整体趋势特征。在一个可选的实现方式中,所述目标音频数据的周期满足预设周期包括:所述目标音频数据的时域周期满足预设时域周期,和/或,所述目标音频数据的频域周期满足预设频域周期。在一个可选的实现方式中,所述目标音频数据的持续时间大于预设时间。在一个可选的实现方式中,所述装置还包括:第二获取单元,用于获取所述SVDD模型。在一个可选的实现方式中,所述第二获取单元包括:第二计算子单元,用于计算所述音频数据样本的MFCC,得到N*L系数矩阵,其中,N为所述音频数据样本的帧数,L为MFCC系数长度;第二分解子单元,用于利用奇异值分解SVD方法分解所述N*L系数矩阵,获得第二目标矩阵;第二降维处理子单元,用于对所述第二目标矩阵进行降维处理后,获得预设数目的特征向量,所述预设数目的特征向量中包含所述音频数据样本的整体趋势特征;训练子单元,用于利用SVDD算法训练所述预设数目的特征向量,得到所述SVDD模型。第三方面,本专利技术实施例提供了一种鼾声检测设备,包括处理器、输入设备、输出设备和存储器,其中:所述处理器、所述输入设备、所述输出设备和所述存储器相互连接,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面或第一方面的任意一种可能实现方式所描述的方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被鼾声检测装置的处理器执行时,使所述处理器执行上述第一方面或者第一方面的任意一种可能实现方式所描述的方法。第五方面,本专利技术实施例提供一种包含程序指令的计算机程序本文档来自技高网
...
鼾声检测方法、装置、设备及介质

【技术保护点】
一种鼾声检测方法,其特征在于,包括:获取与目标音频数据对应的目标特征向量,并将所述目标特征向量输入支持向量数据描述算法SVDD模型中,获得判别结果;所述目标特征向量为对所述目标音频数据的梅尔频率倒频系数MFCC经过特征提取后获得的特征向量;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。

【技术特征摘要】
1.一种鼾声检测方法,其特征在于,包括:获取与目标音频数据对应的目标特征向量,并将所述目标特征向量输入支持向量数据描述算法SVDD模型中,获得判别结果;所述目标特征向量为对所述目标音频数据的梅尔频率倒频系数MFCC经过特征提取后获得的特征向量;在所述目标音频数据的周期满足预设周期,且所述判别结果符合预设结果的情况下,确定所述目标音频数据为鼾声。2.根据权利要求1所述的方法,其特征在于,所述获取与目标音频数据对应的目标特征向量包括:计算所述目标音频数据的MFCC,得到X*Y系数矩阵,其中,X为目标音频数据的帧数,Y为MFCC系数长度;利用奇异值分解SVD方法分解所述X*Y系数矩阵,获得第一目标矩阵;对所述第一目标矩阵进行降维处理后,得到所述目标特征向量,所述目标特征向量包括所述目标音频数据的整体趋势特征。3.根据权利要求1或2所述的方法,其特征在于,所述目标音频数据的周期满足预设周期包括:所述目标音频数据的时域周期满足预设时域周期以及所述目标音频数据的频域周期满足预设频域周期中的至少一种。4.根据权利要求1所述的方法,其特征在于,所述将所述目标音频数据输入支持向量数据描述算法SVDD模型之前,所述方法还包括:获取所述SVDD模型。5.根据权利要求4所述的方法,其特征在于,所述获取所述SVDD模型包括:获取音频数据样本并计算所述音频数据样本的MFCC,得到N*L系数矩阵,其中,N为所述音频数据样本的帧数,L为MFCC系数长度;利用奇异值分解SVD方法分解所述N*L系数矩阵,获得第二目标矩阵;对所述第二目标矩阵进行降维处理后,获得预设数目的特征向量,利用SVDD算法训练所述预设数目的特征向量,得到所述SVDD模型,所述预设数目的特征向量中包含所述音频数据样本的整体趋势特征。6.一种鼾声检测装置,其特征在于,包括:第一获取单元,用于获取与目标音频数据对应的目标特征向量;输入获得单元,用于将所述目标特征向量输入支持向量数据描述算法SVDD模型中,获得判别结果,所述目标特征向量为对所述目标音频数据的梅尔频率倒频系数MFCC经过特征提取后获得的特征向量;确定单...

【专利技术属性】
技术研发人员:冯澍婷刘洪涛孟亚彬
申请(专利权)人:深圳和而泰智能控制股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1