一种基于双向长短时记忆神经网络的智能心音识别方法技术

技术编号:19853173 阅读:36 留言:0更新日期:2018-12-22 10:29
本发明专利技术涉及生理信号识别的技术领域,更具体地,涉及一种基于双向长短时记忆神经网络的智能心音识别方法,首先采用小波尺度变换对原始数据进行滤波处理,然后把一段长的心音数据切分成每段30s长度的信号,接着计算每一段信号的MFCC系数,MFCC一阶差分系数以及MFCC二阶差分系数,最后利用大量的心音数据,采用最新的双向LSTM神经网络来实现对心音数据的智能分类。本发明专利技术采用双向LSTM神经网络来对心音数据进行分类,由于双向LSTM网络具有‘记忆’功能,能够充分的考虑序列数据的前后关系,挖掘内部的关键特征,同时还能联系前后时刻的隐含信息,训练时模型的收敛速度更快,具有较高的准确度。

【技术实现步骤摘要】
一种基于双向长短时记忆神经网络的智能心音识别方法
本专利技术涉及生理信号识别的
,更具体地,涉及一种基于双向长短时记忆神经网络的智能心音识别方法。
技术介绍
心音信号是由心脏跳动过程中心脏各瓣膜的开闭及血液流动所产生的震动形成的。它包含着心脏各个部位,包含心室,心房心血管以及各瓣膜功能状态的大量信息,不同的心脏疾病所发出的心音有所不同。因此心音检测是临床上评估心功能及诊断各种心脏疾病的重要方法之一。由于大数据与硬件设备的发展,深度神经网络在大数据集上得以训练,能够自动地提取数据中潜在的特征,并且实现自动识别与分类。目前,很多的心音分类与识别方案都是先提取心音的频谱特征或者时域特征,然后利用传统的算法模型,比如混合高斯模型(GMM),隐马尔可夫模型(HMM),支持向量机(SVM)来实现对每个病人的心音进行分类,也有利用深度学习来对心音进行分类的方案。然而,传统算法对于大量的高维数据不能充分挖掘其中特征与特征之间的内在关联,导致准确率下降;利用卷积神经网络处理心音数据,对于单纯的时间序列的数据,卷积神经网络并不能胜任。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于双向长短时记忆神经网络的智能心音识别方法,采用双向长短时记忆神经网络对心音数据进行识别和分类,能够获得较高的分类准确率。为解决上述技术问题,本专利技术采用的技术方案是:提供一种基于双向长短时记忆神经网络的智能心音识别方法,包括以下步骤:S1.采用多尺度小波变换对原始心音信号进行滤波处理得到滤除高频噪声的心音信号;S2.将步骤S1中所述滤除高频噪声的心音信号按每段25s~40s的时间长度进行切分;S3.提取步骤S2中每一段心音信号的MFCC特征;S4.建立双向长短时记忆神经网络分类模型,并对神经网络分类模型进行训练,保存训练好的分类模型;S5.将待检测的心音信号输入步骤S4中训练好的分类模型中,预测未知类别的心音信号。本专利技术的基于双向长短时记忆神经网络的智能心音识别方法,只需要简单地提取MFCC特征就可以作为神经网络的输入,然后神经网络的输出就是分类结果;双向长短时记忆神经网络能够充分地考虑序列数据的前后关系,挖掘内部的关键特征,实现对心音数据的分类,使得分类的准确度比传统的方法更高。优选地,步骤S1中,所述原始心音信号的频率为10Hz~100Hz,所述多尺度小波变换采用的小波基为db5;所述原始心音信号经两个尺度的变换,去掉高频系数,再重构近似系数得到滤除高频噪声的心音信号。对于设备采集到的原始心音信号存在较大的噪声,这些噪声有些是环境噪声,有些是工频噪声,为了得到较为纯净的心音信号,首先要对心音数据进行去噪即滤波处理;由于心音在时域上是连续的非平稳信号,同时考虑到计算量的大小,因此采用多尺度小波变换来对原始心音信号进行滤波处理得到滤除高频噪声的心音信号。优选地,步骤S2中,心音信号切分的时间长度为30s。从临床上来看,30s的时间长度可以达到诊断的效果,这样也可以为神经网络减少计算量。优选地,步骤S3中,所述MFCC特征的提取方法包括以下步骤:S31.对每一段心音信号的高频段进行预加重处理后进行分帧处理;由于声音信号具有短时平稳性,10ms~30ms内可以认为语音信号近似不变,将心音信号分为一些短段来进行处理,即分帧,分帧是利用滑动的窗口进行加权来实现的;S32.将步骤S31分帧处理得到的每一帧信号做离散傅里叶变换或快速傅里叶变换后送入Mel频率滤波器组处理得到输出信号;S33.将步骤S32中所述的输出信号进行取对数变换;S34.将经步骤S33对数变换的输出信号进行离散余弦变换得到MFCC系数。MFCC系数是信号的静态特征,设置维度为19维;为了获取信号动态特征,再计算19维的一阶差分系数和19维的二阶差分系数。优选地,步骤S31中,当分帧处理得到的段信号的帧数小于预设帧数时采用补零的方式处理。每缺少一帧,补39个零;考虑到时间太短无法准确诊断各类疾病,所以对于长度小于15s的心音,直接扔掉。这样处理,所有的心音片段提取出来的特征长度便能够保持一致。优选地,步骤S32中所述Mel频率滤波器组包括若干临界带滤波器,每个临界带滤波器的输出为该临界带滤波器内所有信号频谱幅值的加权和。优选地,步骤S4中,所述双向长短时记忆神经网络包括输入层、第一双向LSTM层、第一随机置零层、第二双向LSTM层、第二随机置零层以及输出层。优选地,所述输入层、第一双向LSTM层、第一随机置零层、第二双向LSTM层、第二随机置零层以及输出层每一层神经元个数及参数设置为:(1)输入层:步骤S2中每一段心音信号经过提取MFCC特征之后变成矩阵,输入层接受所述矩阵;(2)第一双向LSTM层:隐层神经元设置为64,用于自动提取数据内在的时序特征,并设置每一帧输出一位信息,以矩阵形式输出;(3)第一随机置零层:设置随机置神经元个数为零的概率为0.3,随机使得某一些神经元置零,有效防止过拟合,以矩阵形式输出;(4)第二双向LSTM层:隐层神经元设置为64,用于挖掘数据潜在的特征,每段时间长度输出一位信息,将第一随机置零层输出的矩阵压缩为抽象化特征;(5)第二随机置零层:设置随机置神经元个数为零的概率为0.3,随机使得某一些神经元置零;(6)输出层:输出层的神经元个数与心音的类别数一致,输出N个概率值,每个概率值代表一种类别,并取N个概率值中最大一个所在位置作为最终的分类标签。优选地,在训练开始前,每种心音类别的标签进行独热编码;将样本数据和对应的标签放入构建好的神经网络模型中训练。训练过程就相当于学习的过程,将音频数据放入到网络,让其预测一个标签,模型预测的标签可能和真实的标签相差很大。如果发现不准确,则网络会自动修改连接参数,使其预测和真实标签更接近,如此重复,不断地把数据送进网络,不断地与把数据送进网络,不断地与真实标签对比,然后不断地修改网络的连接权重,使其越来越接近真实的标签值,知道误差不再变化或者误差很小为止,则停止网络模型的训练,网络的连接参数也随之固定下来。优选地,所述标签包括正常、不正常、二联律以及奔马律。与现有技术相比,本专利技术的有益效果是:(1)本专利技术采用的双向LSTM网络能够充分的考虑序列数据的前后关系,挖掘内部的关键特征,从而实现对心音数据的分类,使得比传统的方法具有更高的分类的准确度。(2)本专利技术可作为医生给病人看病的辅助方法,辅助医生诊断,从而减轻医生的工作负担,提高工作效率。附图说明图1为基于双向长短时记忆神经网络的智能心音识别方法的流程图。图2为实施例一中一段2.5s时间的原始心音信号。图3为图2的心音信号经小波第一尺度和第二尺度变换后的信号。图4为MFCC系数的提取过程流程图。图5为双向LSTM神经网络示意图。图6为图5所示双向LSTM神经网络分类示意图。图7为实施例应用于系统的工作流程图。具体实施方式下面结合具体实施方式对本专利技术作进一步的说明。其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本专利技术的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。本专利技术实施例的附图中相同或相似的标号对应相同本文档来自技高网...

【技术保护点】
1.一种基于双向长短时记忆神经网络的智能心音识别方法,其特征在于,包括以下步骤:S1.采用多尺度小波变换对原始心音信号进行滤波处理得到滤除高频噪声的心音信号;S2.将步骤S1中所述滤除高频噪声的心音信号按每段25s~40s的时间长度进行切分;S3.提取步骤S2中每一段心音信号的MFCC特征;S4.建立双向长短时记忆神经网络分类模型,并对神经网络分类模型进行训练,保存训练好的分类模型;S5.将待检测的心音信号输入步骤S4中训练好的分类模型中,预测未知类别的心音信号。

【技术特征摘要】
1.一种基于双向长短时记忆神经网络的智能心音识别方法,其特征在于,包括以下步骤:S1.采用多尺度小波变换对原始心音信号进行滤波处理得到滤除高频噪声的心音信号;S2.将步骤S1中所述滤除高频噪声的心音信号按每段25s~40s的时间长度进行切分;S3.提取步骤S2中每一段心音信号的MFCC特征;S4.建立双向长短时记忆神经网络分类模型,并对神经网络分类模型进行训练,保存训练好的分类模型;S5.将待检测的心音信号输入步骤S4中训练好的分类模型中,预测未知类别的心音信号。2.根据权利要求1所述的基于双向长短时记忆神经网络的智能心音识别方法,其特征在于,步骤S1中,所述原始心音信号的频率为10Hz~100Hz,所述多尺度小波变换采用的小波基为db5;所述原始心音信号经两个尺度的变换,去掉高频系数,重构近似系数得到滤除高频噪声的心音信号。3.根据权利要求1所述的基于双向长短时记忆神经网络的智能心音识别方法,其特征在于,步骤S2中,心音信号切分的时间长度为30s。4.根据权利要求1所述的基于双向长短时记忆神经网络的智能心音识别方法,其特征在于,步骤S3中,所述MFCC特征的提取方法包括以下步骤:S31.对每一段心音信号的高频段进行预加重处理后进行分帧处理;S32.将步骤S31分帧处理得到的每一帧信号做离散傅里叶变换或快速傅里叶变换后送入Mel频率滤波器组处理得到输出信号;S33.将步骤S32中所述的输出信号进行取对数变换;S34.将经步骤S33对数变换的输出信号进行离散余弦变换得到MFCC系数。5.根据权利要求4所述的基于双向长短时记忆神经网络的智能心音识别方法,其特征在于,步骤S31中,当分帧处理得到的段信号的帧数小于预设帧数时采用补零的方式处理。6.根据权利要求4所述的基于双向长短时记忆神经网络的智能心音识别方法,其特征在于,步骤S3...

【专利技术属性】
技术研发人员:舒宁徐悦
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1