一种鼾声识别方法与系统技术方案

技术编号:20372089 阅读:35 留言:0更新日期:2019-02-19 19:39
本发明专利技术公开了一种鼾声识别方法与系统,包括以下几个部分:获得鼾声的音频信号数据;对获取的音频信号数据进行预处理,获取鼾声信号段;建立卷积神经网络模型,使用训练样本训练网络;将待诊断的鼾声音频数据输入到训练好的网络,输入得到鼾声识别结果。本发明专利技术通过对获取的音频信号预处理得到鼾声音频信号,使用卷积神经网络识别鼾声,提高了鼾声检测的准确率。

A Snore Recognition Method and System

The invention discloses a snoring recognition method and system, which includes the following parts: acquiring the audio signal data of snoring; preprocessing the acquired audio signal data to obtain snoring signal segments; establishing a convolutional neural network model and using training samples to train the network; inputting the data of snoring sound to the trained network to obtain the snoring recognition results. \u3002 The snoring sound frequency signal is obtained by preprocessing the acquired audio signal, and the snoring sound is recognized by convolution neural network, thus improving the accuracy of snoring detection.

【技术实现步骤摘要】
一种鼾声识别方法与系统
本专利技术涉及辅助医疗
,具体地是涉及一种鼾声识别方法与系统。
技术介绍
阻塞性睡眠呼吸暂停低通气综合征(OSAHS)是较为严重的睡眠呼吸障碍,病症主要表现为患者在睡觉过程中呼吸道软腭多次内陷,反复阻塞气道,导致呼吸受阻,临床表现为晚上睡觉时打鼾并伴随呼吸暂停或呼吸气流流量小。呼吸暂停是指患者在睡觉时呼吸气流消失超过10秒的情况,低通气是指患者在睡觉时呼吸气流强度低于基本值的50%,同时血氧浓度下降到低于正常水平96%的情况。对于OSAHS的检测,传统的方法是通过多导睡眠监测装置对病人进行6至7小时的睡眠监督和测量,可记录并分析EEG(脑电图)、ECG(心电图)、EOG(眼电图)、EMG(肌电图),鼾声、血氧饱和度、呼吸频率、体位等多个睡眠时的体征参数,该方法准确可靠,但是由于需要在患者身上安置超过15个导联,影响到了患者的正常睡眠状态,并且价格不菲,而且通过多导睡眠图(PSG)获取的信息必须利用人工辨别出现的问题,非常不便,人们正在寻找经济有效且可靠的辅助诊断方法。鉴于鼾声的产生与呼吸道的生理结构关系紧密,鼾声极有可能能够反映出患者呼吸道发生病变的一些情况,并且有研究表明普通打鼾者发出的鼾声同OSAHS患者之间的鼾声存在一定的差异。AHI指数(暂停低通气指数)是判定OSAHS患者患病程度的最直观的标准,如果不对鼾声进行分类将很难从鼾声获取病人的AHI指数,因此对患病鼾声进行分类研究有其必要性,且通过将病患的整晚鼾声进行分类识别将有助于OSAHS患者病情的诊断和监控。目前,鼾声识别主要分为鼾声段检测和识别两部分。对鼾声段检测,大部分采用的是信号门限,容易出现误判。鼾声识别部分,使用比较常规的分类模型,当有与鼾声频率相近的声音干扰时,会误检测为鼾声,导致最终的模型精度准确率较低。因此,本专利技术的专利技术人亟需构思一种新技术以改善其问题。
技术实现思路
为解决上述技术问题,本专利技术提供了一种鼾声识别方法与系统。本专利技术的技术方案是:一种鼾声识别方法,包括如下步骤:S1:获得鼾声的音频信号数据;S2:对获取的音频信号数据进行预处理,获取鼾声信号段;S3:建立卷积神经网络模型,使用训练样本训练网络;S4:将待诊断的鼾声音频信号数据输入到训练好的网络,得到鼾声识别结果。优选地,所述步骤S2具体包括:S21:对音频信号数据进行降噪预处理,滤除因为声音采集环境不同导致的不同程度的背景噪声;S22:通过预加重补充高频部分,减少口鼻辐射和声门脉冲带来的影响,提高信号频谱平坦度,降低低频干扰;S23:将信号分成多个相对较短的片段,以保证短时间内信号是平稳的;S24:将有声段与静音段分离。优选地,所述步骤S24中使用过零率和短时能量相结合的双门限法与自适应阈值法相结合的方法将有声段与静音段分离。优选地,所述步骤S22中使用一阶FIR高通滤波器对数据进行预加重,其传输函数为:H(Z)=1-bZ-1。优选地,所述自适应阈值法是把整段声音分为每N个离散点一组,取出每组中的最大幅值形成一个新的离散序列,再对这个序列中每N个离散点求和得到一个新的数组,将这个数组平滑滤波后,对其做柱状图区间统计,点最多的幅值区间就视为这段声音的噪声幅值,也是有声与无声的区分门限;计算整段声音的短时能量和过零率,同样利用柱状图区间统计点最多的幅值区间获取短时能量和过零率的门限;使用时自适应阈值法话语权高于双门限法。一种鼾声识别系统,包括:声音获取模块,用于获得鼾声的音频信号数据;预处理模块,用于对获取的音频信号数据进行预处理,获取鼾声信号段;模型建立模块,用于建立卷积神经网络模型,使用训练样本训练网络;识别模块,用于将待诊断的鼾声音频信号数据输入到训练好的网络,得到鼾声识别结果。优选地,所述预处理模块具体包括:降噪预处理单元,用于对音频信号数据进行降噪预处理,滤除因为声音采集环境不同导致的不同程度的背景噪声;预加重单元,用于通过预加重补充高频部分,减少口鼻辐射和声门脉冲带来的影响,提高信号频谱平坦度,降低低频干扰;分帧处理单元,用于将信号分成多个相对较短的片段,以保证短时间内信号是平稳的;信号分离单元,用于将有声段与静音段分离。优选地,所述信号分离单元使用过零率和短时能量相结合的双门限法与自适应阈值法相结合的方法将有声段与静音段分离。优选地,所述预加重单元使用一阶FIR高通滤波器对数据进行预加重,其传输函数为:H(Z)=1-bZ-1。优选地,所述自适应阈值法是把整段声音分为每N个离散点一组,取出每组中的最大幅值形成一个新的离散序列,再对这个序列中每N个离散点求和得到一个新的数组,将这个数组平滑滤波后,对其做柱状图区间统计,点最多的幅值区间就视为这段声音的噪声幅值,也是有声与无声的区分门限;计算整段声音的短时能量和过零率,同样利用柱状图区间统计点最多的幅值区间获取短时能量和过零率的门限;使用时自适应阈值法话语权高于双门限法。采用上述技术方案,本专利技术至少包括如下有益效果:本专利技术所述的鼾声识别方法与系统,通过过零率和短时能量相结合的双门限法与自适应阈值法相结合的方法来检测出鼾声段,并通过卷积神经网络进行鼾声自动识别。为鼾声的准确检测提供了更为有效的方法,能够对鼾声进行分类,能够自动识别出类别,进而辅助呼吸疾病的诊断。附图说明图1为本专利技术所述的鼾声识别方法的流程图;图2为本专利技术所述的卷积神经网络的架构图;图3为本专利技术所述的鼾声识别系统的结果示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1如图1所示,为符合本实施例的一种鼾声识别方法,包括如下步骤:S1:获得鼾声的音频信号数据;S2:对获取的音频信号数据进行预处理,获取鼾声信号段;S3:建立卷积神经网络模型,使用训练样本训练网络;S4:将待诊断的鼾声音频信号数据输入到训练好的网络,得到鼾声识别结果。优选地,所述步骤S2具体包括:S21:对音频信号数据进行降噪预处理,滤除因为声音采集环境不同导致的不同程度的背景噪声;S22:通过预加重补充高频部分,减少口鼻辐射和声门脉冲带来的影响,提高信号频谱平坦度,降低低频干扰;S23:将信号分成多个相对较短的片段,以保证短时间内信号是平稳的;S24:将有声段与静音段分离。优选地,所述步骤S24中使用过零率和短时能量相结合的双门限法与自适应阈值法相结合的方法将有声段与静音段分离。优选地,所述步骤S22中使用一阶FIR高通滤波器对数据进行预加重,其传输函数为:H(Z)=1-bZ-1,其中b的值接近于1,一般取0.94。优选地,所述自适应阈值法是把整段声音分为每N个离散点一组,取出每组中的最大幅值形成一个新的离散序列,再对这个序列中每N个离散点求和得到一个新的数组,将这个数组平滑滤波后,对其做柱状图区间统计,点最多的幅值区间就视为这段声音的噪声幅值,也是有声与无声的区分门限;计算整段声音的短时能量和过零率,同样利用柱状图区间统计点最多的幅值区间获取短时能量和过零率的门限;使用时自适应阈值法话语权高于双门限法。下面具体阐述本本文档来自技高网
...

【技术保护点】
1.一种鼾声识别方法,其特征在于,包括如下步骤:S1:获得鼾声的音频信号数据;S2:对获取的音频信号数据进行预处理,获取鼾声信号段;S3:建立卷积神经网络模型,使用训练样本训练网络;S4:将待诊断的鼾声音频信号数据输入到训练好的网络,得到鼾声识别结果。

【技术特征摘要】
1.一种鼾声识别方法,其特征在于,包括如下步骤:S1:获得鼾声的音频信号数据;S2:对获取的音频信号数据进行预处理,获取鼾声信号段;S3:建立卷积神经网络模型,使用训练样本训练网络;S4:将待诊断的鼾声音频信号数据输入到训练好的网络,得到鼾声识别结果。2.如权利要求1所述的鼾声识别方法,其特征在于,所述步骤S2具体包括:S21:对音频信号数据进行降噪预处理,滤除因为声音采集环境不同导致的不同程度的背景噪声;S22:通过预加重补充高频部分,减少口鼻辐射和声门脉冲带来的影响,提高信号频谱平坦度,降低低频干扰;S23:将信号分成多个相对较短的片段,以保证短时间内信号是平稳的;S24:将有声段与静音段分离。3.如权利要求2所述的鼾声识别方法,其特征在于:所述步骤S24中使用过零率和短时能量相结合的双门限法与自适应阈值法相结合的方法将有声段与静音段分离。4.如权利要求2或3所述的鼾声识别方法,其特征在于:所述步骤S22中使用一阶FIR高通滤波器对数据进行预加重,其传输函数为:H(Z)=1-bZ-1。5.如权利要求3所述的鼾声识别方法,其特征在于:所述自适应阈值法是把整段声音分为每N个离散点一组,取出每组中的最大幅值形成一个新的离散序列,再对这个序列中每N个离散点求和得到一个新的数组,将这个数组平滑滤波后,对其做柱状图区间统计,点最多的幅值区间就视为这段声音的噪声幅值,也是有声与无声的区分门限;计算整段声音的短时能量和过零率,同样利用柱状图区间统计点最多的幅值区间获取短时能量和过零率的门限;使用时自适应阈值法话语权高于双门限法。6.一种鼾声识别系统,其特征在于,包括...

【专利技术属性】
技术研发人员:万海亚张跃春曾瑜
申请(专利权)人:苏州小蓝医疗科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1