一种基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法技术

技术编号:22886116 阅读:14 留言:0更新日期:2019-12-21 08:04
本发明专利技术公开了一种基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法,首先通过录音设备采集语音信息,然后对语音信息进行预处理,提取语音特征参数MFCC;随后构建ResNet和LSTM神经网络模型对MFCC特征参数进行训练,提取语音信号的深度特征信息;最终将待测试的MFCC特征参数输入到训练完成的模型中,对脑卒中构音障碍患病风险进行预测。本发明专利技术具有方便快捷、节约成本、预测准确率高等优点。

A risk prediction method of stroke dysarthria based on RESNET and LSTM network

【技术实现步骤摘要】
一种基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法
本专利技术涉及深度学习的
,尤其涉及到一种基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法。
技术介绍
“脑卒中”(cerebralstroke)又称“中风”,是一种急性脑血管疾病,是由于脑部血管突然破裂或因血管阻塞导致血液不能流入大脑而引起脑组织损伤的一组疾病。患者会出现无法正常说话,表达时含糊不清的失语症状,严重者还会不由自主的流涎。调查显示,脑卒中已经成为影响中老年人健康的最大威胁之一,脑卒中会遗留有不同程度的肢体功能障碍、感觉障碍、言语障碍、认知障碍等,也是中国成年人残疾的首要原因。经过调查显示,其中言语障碍能够到达35%以上的占比,给患者的生活和治疗带来了巨大困难。目前,针对脑卒中的治疗手段有限,而且疗效也不太理想,所以应加强对全民普及脑卒中危险因素及先兆症状的教育,才能真正防治脑卒中。现有的脑卒中风预测系统,是利用评估软件根据采集的生理数据评估脑卒中和构音障碍等疾病风险指标,然后进行数据处理和结果预测,例如:在外文专利RU2669895C1中,MARTSEVICHSERGEJYUREVICH等人提出了一种检测脑血管意外患者偶发脑卒中的危险因素的方法,可用于预测小缺血性脑卒中、缺血性脑卒中、小出血性脑卒中、出血性脑卒中患者反复发生脑卒中(CS)的风险。该方法选择药物治疗后病人的门诊监测阶段,执行一个随着时间记录的疾病存在测试,并进行额外的临床诊断检查;其中包括心电图和日常霍尔特监测心电图,还需进行每日监测血压(BPM)和自我监测血压(BPSM)测试,通过检查收集各种身体素质数值相关的最重要因素组合,例如血脂血压、脑部区域图像等数据,采用聚类方法综合各项参数预测患病几率。该方法提供了一种准确的风险评估体系,需要采集大量数据完成疾病检测。在专利文献CN108670199A中,暨南大学提出了一种构音障碍元音评估模板及评估方法,提供一种构音障碍元音评估模板,通过元音共振峰直观评估是否存在构音障碍,使构音障碍康复评估更加智能化和客观化,使康复训练更加个性化和精准化。评估方法为将需要评估的受试者,通过计算机提取出的多种元音共振峰值逐一描记在评估底板的坐标上,然后插入构音障碍元音模板,通过观察患者多种元音的共振峰坐标点是否在相应元音椭圆范围内,评估是否出现构音障碍,并判断构音障碍的元音异常类型,通过离散程度,间接推断哪些元音出现障碍程度更明显。在专利文献CN109559761A中,提出了一种基于深度语音特征的脑卒中风险预测方法,该方法通过采集脑卒中高风险人群的一段特定的语音,然后通过语音处理软件提取语音信息中的MFCC(Mel-scaleFrequencyCepstralCoefficients)特征,将MFCC语音特征参数通过深度学习中的卷积神经网络(CNN)提取深度语音特征参数。卷积神经网络可以利用不同的卷积核、池化层和最后输出的特征参数的大小控制整体模型的拟合能力,并且结合全连接层的逻辑回归算法完成病人与患者的分类。最后将用于测试的MFCC特征参数输入到训练完成的逻辑回归分类模型中,获取脑卒中风险概率。但现有的该些技术在脑卒中风险预测过程中,需要长时间采集相关信息,必须拥有大量的病例数据,而且系统预测周期过长,不能达到高效率的标准。使用传统卷积神经网络作为脑卒中风险预测的模型,不能够保证准确率达到标准。以上问题可能会延误最佳治疗时机,风险预测存在不确定性。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种方便快捷、节约成本、预测准确率高的基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法。为实现上述目的,本专利技术所提供的技术方案为:一种基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法,首先通过录音设备采集语音信息,然后对语音信息进行预处理,提取语音特征参数MFCC;随后构建ResNet和LSTM神经网络模型对MFCC特征参数进行训练,提取语音信号的深度特征信息,构建分类器完成患者和正常人群的分类,得到风险预测模型;最终将待测试的MFCC特征参数输入到训练完成的模型中,对脑卒中构音障碍患病风险进行预测。进一步地,所述采集语音信息具体为:选择安静的治疗室,使用录音设备收集特定的语音信息,收集到的语音信息中包括脑卒中风患者和正常人的,保持每一类包含的人数相同,然后将语音数据按比例划分为训练集、测试集和验证集。进一步地,所述提取语音特征参数MFCC的具体过程如下:1)对语音信息进行预处理;2)对各帧信号进行快速傅里叶变换得到各帧的频谱;3)将能量谱通过一组Mel尺度的三角形滤波器组;4)计算每个滤波器组输出的对数能量,每一帧的对数能量加上一帧的对数能量,使得每一帧基本的语音特征多一维,包括一个对数能量和剩下的倒频谱参数;每个滤波器的对数能量计算公式如下:其中,Hm(k)为三角滤波器的频率响应定义,xa(k)为快速傅里叶变换得到的频谱,m为Mel滤波器组中滤波器的编号,M表示滤波器个数,N为分帧时候的采样点个数,即将N个采样点合成一个观测单位,称为帧;5)将对数能量带入离散余弦变换,求出L阶的参数,公式如下:其中,L阶指MFCC系数阶数,M表示三角滤波器个数。进一步地,所述对语音信息进行预处理的具体步骤如下:预加重:通过高通滤波器减少信息的流失,增加语音的高频分辨率;分帧;将N个采样点集合成一个观测单位,称为帧;让两相邻帧之间有一段重叠区域,此重叠区域包含M个取样点,M的值为N的1/2或1/4;加窗;将每一帧乘以汉明窗。进一步地,所述构建ResNet和LSTM神经网络模型对MFCC特征参数进行训练的具体步骤如下:首先通过ResNet网络对MFCC特征参数进行训练,在ResNet直接使用stride=2的卷积做下采样,并且用GlobalAveragePool层替换全连接层,解决深度网络退化问题;利用Resnet网络不同的卷积核、池化层和最后输出的特征参数的大小控制整体模型的拟合能力,一步一步提取和分析语音信息中的特征;经过在ResNet网络处理后,继续添加LSTM层,以将LSTM最后一个时刻的输出作为特征向量的表示,以及综合考虑每个时刻的的输出,将它们合并为一个向量,再使用全连接层与激活函数softmax输出概率分布;训练完成后继续调整参数,重复实验,最终得到分类器用于预测脑卒中风。与现有技术相比,本方案原理及优点如下:与专利RU2669895C1相比,本方案引入人工神经网络分类器这一模型。相比传统的聚类和医学常用统计算法,拥有不同层次卷积核的ResNet网络学习能力更强,能够发掘出语音信息的深度特征,配合LSTM网络(长短期记忆网络)在时间序列上对MFCC特征参数进一步处理,使得实验结果更加准确。另外,本方案实验数据获取方便,仅需要录制特定的语音片段就可以作为判断的依据,相比RU2669895C1文献提出的方法,不必本文档来自技高网
...

【技术保护点】
1.一种基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法,其特征在于,首先通过录音设备采集语音信息,然后对语音信息进行预处理,提取语音特征参数MFCC;随后构建ResNet和LSTM神经网络模型对MFCC特征参数进行训练,提取语音信号的深度特征信息,构建分类器完成患者和正常人群的分类,得到风险预测模型;最终将待测试的MFCC特征参数输入到训练完成的模型中,对脑卒中构音障碍患病风险进行预测。/n

【技术特征摘要】
1.一种基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法,其特征在于,首先通过录音设备采集语音信息,然后对语音信息进行预处理,提取语音特征参数MFCC;随后构建ResNet和LSTM神经网络模型对MFCC特征参数进行训练,提取语音信号的深度特征信息,构建分类器完成患者和正常人群的分类,得到风险预测模型;最终将待测试的MFCC特征参数输入到训练完成的模型中,对脑卒中构音障碍患病风险进行预测。


2.根据权利要求1所述的一种基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法,其特征在于,所述采集语音信息具体为:
选择安静的治疗室,使用录音设备收集特定的语音信息,收集到的语音信息中包括脑卒中风患者和正常人的,保持每一类包含的人数相同,然后将语音数据按比例划分为训练集、测试集和验证集。


3.根据权利要求1所述的一种基于ResNet与LSTM网络的脑卒中构音障碍风险预测方法,其特征在于,所述提取语音特征参数MFCC的具体过程如下:
1)对语音信息进行预处理;
2)对各帧信号进行快速傅里叶变换得到各帧的频谱;
3)将能量谱通过一组Mel尺度的三角形滤波器组;
4)计算每个滤波器组输出的对数能量,每一帧的对数能量加上一帧的对数能量,使得每一帧基本的语音特征多一维,包括一个对数能量和剩下的倒频谱参数;每个滤波器的对数能量计算公式如下:



其中,Hm(k)为三角滤波器的频率响应定义,xa(k)为快速傅里叶变换得到的频谱,m为Mel滤波器组中滤波器的编号,M表示滤波器个数,N为分帧时候的采...

【专利技术属性】
技术研发人员:叶武剑李琪刘怡俊牟志伟李学易
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1