基于深度学习的阿尔茨海默症语音信号的筛查方法技术

技术编号:20798987 阅读:24 留言:0更新日期:2019-04-06 12:40
基于深度学习的阿尔茨海默症语音信号的筛查方法,涉及语音处理技术,包括步骤:训练深度置信网络模型备用;使被检测者进行不同口语产出任务并采集被检测者的语音;对所采集语音进行预处理;提取预处理后的语音中和阿尔茨海默症相关的病理特征并将其输入训练好的深度置信网络模型进行训练得到优化特征;将优化特征输入训练好的SVM分类器进行分类,分类结果即为筛查结果。本发明专利技术的基于深度学习的阿尔茨海默症语音信号的筛查方法,利用深度学习实现了AD快速筛查,只通过被试者语音即可做出初步判断,方法简单,智能化程度高。

Alzheimer's Disease Speech Signal Screening Method Based on Deep Learning

The method of Alzheimer's disease speech signal screening based on in-depth learning involves speech processing technology, including steps: training depth confidence network model standby; enabling the examinee to perform different oral output tasks and collect the voice of the examinee; preprocessing the collected voice; extracting the pathological features related to Alzheimer's disease from the pretreated voice and transporting them. The trained deep belief network model is used to train the optimized feature, and the trained SVM classifier is used to classify the optimized feature, and the classification result is the screening result. The method of screening Alzheimer's disease speech signal based on in-depth learning of the present invention realizes rapid screening of AD by in-depth learning, and can make preliminary judgment only through the voice of the subjects. The method is simple and highly intelligent.

【技术实现步骤摘要】
基于深度学习的阿尔茨海默症语音信号的筛查方法
本专利技术涉处语音信号处理技术,具体涉及基于深度学习的阿尔茨海默症语音信号的筛查方法。
技术介绍
阿尔茨海默症(Alzheimer’sdisease,AD),成为老龄社会关注热点之一。全国流行病学调查则显示我国65岁以上人口的阿尔茨海默症患病率达4.8%;目前临床AD诊断需经历2-3小时的标准神经心理评估和可获得性低且昂贵的基PET或创伤性脊髓穿刺的神经标记物检查,应用这种常规途径去筛查动辄近千万潜在的痴呆患者是非常困难的。早有研究观察到AD患者口语产出的障碍并发现语言功能的异常可以作为AD评估和诊断的重要依据,因此通过对被测者语音信号特征的分析,利用深度神经网络算法训练病理特征模型,寻找AD患者的有效病理特征,通过SVM分类器实现对AD患者以非侵入式的方式进行快速筛查,为AD的临床诊断提供一种低成本,可行性高,结构简单,智能化的客观测量方法。
技术实现思路
本专利技术的目的是提供一种基于深度置信网络特征优化的阿尔茨海默症的快速筛查技术,通过对被试者语音信号的处理分析,提取相关病理特征,包括基频、基频微扰(jitter)、振幅微扰(shimmer)、谐噪比(HNR)、信噪比(SNR)、短时过零率、短时能量、共振峰、MFCC、LPC、语音停顿、语速。对提取的病理特征进行分析,建立并训练用于特征优化的深度置信网络模型以及用于分类的SVM分类模型,从而实现对阿尔茨海默症患者的快速筛查。为实现以上专利技术目的,本专利技术的技术方案如下:基于深度学习的阿尔茨海默症语音信号的筛查方法,包括步骤:S1:训练深度置信网络模型备用;S2:使被检测者进行不同口语产出任务并采集被检测者的语音;S3:对所采集语音进行预处理;S4:提取预处理后的语音中和阿尔茨海默症相关的病理特征并将其输入训练好的深度置信网络模型进行训练得到优化特征;S5:将优化特征输入训练好的SVM分类器进行分类,分类结果即为筛查结果。作为本专利技术进一步改进的技术方案,所述步骤S2具体包括:测量现场噪音,排除噪声源,在噪声符合要求之后进行语音采集;语音采集过程中,对被测者进行不同口语产出任务,对语音进行标记整理。作为本专利技术进一步改进的技术方案,所述步骤S2具体包括:测量现场噪音,排除噪声源,在噪声符合要求之后进行语音采集;语音采集过程中,对被测者进行不同口语产出任务,口语产出任务包括自我介绍、言语流畅性测试、图画描述、连续发元音,对语音进行标记整理。作为本专利技术进一步改进的技术方案,所述步骤S3具体包括:对采集到的语音数据进行去噪,参数规整,预加重,加窗和分帧处理,获取语音帧序列。作为本专利技术进一步改进的技术方案,所述步骤S3具体包括:对采集到的语音数据进行去噪,参数规整,预加重,加窗和分帧处理,获取语音帧序列,其中预加重,加窗,分帧通过openSMILE进行预处理。作为本专利技术进一步改进的技术方案,所述步骤S4具体包括:提取语音帧序列中各语音帧的病理特征并对病理特征提取一阶差分和二阶差分,组成新的多维病理特征,将多维病理特征输入训练好的深度置信网络模型,输出优化特征。作为本专利技术进一步改进的技术方案,所述步骤S4具体包括:提取语音帧序列中各语音帧的病理特征并对病理特征提取一阶差分和二阶差分,组成新的多维病理特征,其中,病理特征包括:基频、基频微扰、振幅微扰、谐噪比、信噪比、短时过零率、短时能量、共振峰、MFCC、LPC、语音停顿和语速,将多维病理特征输入训练好的深度置信网络模型,输出优化特征。作为本专利技术进一步改进的技术方案,所述步骤S5具体包括:将优化特征作为输入放入训练好的SVM分类器中进行分类,分类结果即为检测结果,其中,SVM分类器模型的训练过程为:将训练集中的数据经过预处理,病理特征提取,放入深度置信网络模型得到的优化特征输入SVM分类器进行训练得到训练好的SVM分类器模型。。与现有技术相比,本专利技术的有益效果:本专利技术的基于深度学习的阿尔茨海默症语音信号的筛查方法,利用深度学习实现了AD快速筛查,只通过被试者语音即可做出初步判断,方法简单,智能化程度高。附图说明图1是本专利技术的方法流程示意图;图2是语音采集流程示意图;图3是语音预处理流程示意图;图4是特征提取流程示意图;图5是深度网络框架训练优化特征示意图;图6为RBM参数训练的流程图;图7为SVM分类器训练分类流程图。具体实施方式:下面参照附图对本专利技术做进一步描述。实施例图1是本专利技术的基于深度学习的阿尔茨海默症语音信号的筛查方法的流程示意图,包括步骤:1)对被试者进行不同口语产出任务时的语音进行采集并整理;2)对上述语音进行预处理;3)提取上述语音的声学特征并将其输入深度置信神经网络进行训练得到优化特征;4)将优化特征输入训练好的SVM分类器进行分类,实现通过输入的语音自动识别阿尔茨海默症患者。图2是语音采集流程示意图。该部分的作用在于:为实验采集初始数据,收集用于后续算法需要的训练语音文件。首先主持测试的人员测量现场噪音,若现场噪音高于55dB,则排除噪声源,待噪声降至55dB以下时,再进行语音采集。语音采集过程中,对被测者进行不同口语产出任务,包括“自我介绍”,“言语流畅性测试”,“图画描述”,“连续发元音”四个个不同的口语产出任务,对语音进行保存。其中,训练集的语音保存,标记,整理部分是将每一位被试者的所有录音文件保存在与被试编号相同的文件夹下,保存过程不带有个人信息,仅保留用以区分的编号以及诊断结果(青年人,正常老人,AD患者或未经诊断)。图3是语音预处理流程示意图。分别对训练数据和测试数据进行去噪,参数规整,同时依次进行预加重,加窗和分帧处理,获取语音帧序列。去噪。利用自动切分程序对语音进行精检测并去除咳嗽等噪声干扰,针对训练数据再进行人工校对,对语音段中出现的明显噪声和长静音段进行标注并切割。参数规整,由于录制环境、设备各有差异,在数据汇总后,按照实验要求统一采样率、比特率等参数,利用Audition软件进行幅度归一化处理,消除干扰。切分,为了检验不同时长语音段对辨别效果的影响,将设计自动切分程序对训练数据进行整合切分,可手动设置切分时长。对采集的语音信号进行处理后,进行病理特征提取。图4是病理特征提取流程图,提取的特征包括但不限于:基频、基频微扰(jitter)、振幅微扰(shimmer)、谐噪比(HNR)、信噪比(SNR)、短时过零率、短时能量、共振峰、MFCC、LPC、语音停顿、语速。训练数据也进行特征提取过程。下面以MFCC特征为例进行说明。在提取各语音帧的MFCC特征时,首先通过傅里叶变换和取模得到频域信号,并经过三角滤波函数得到梅尔域的输出,取对数经过离散余弦变化进行去相关处理,得到13阶MFCC参数,再对其提取一阶差分和二阶差分,组成39维MFCC特征。其中提取特征的方法包括,利用openSMILE计算包括基频、基频微扰(jitter)、振幅微扰(shimmer)、MFCC、LPC等特征;利用MATLAB的工具包voicebox提取包括谐噪比(HNR)、信噪比(SNR)、短时过零率、短时能量等特征;其中语速,语音停顿和共振峰特征使用praat脚本实现;特别地,对于AD患者病理特征之一的语音停顿特征的提取,要包括对语音段总时长,发生总时长,停顿总本文档来自技高网...

【技术保护点】
1.基于深度学习的阿尔茨海默症语音信号的筛查方法,其特征在于,包括步骤:S1:训练深度置信网络模型备用;S2:使被检测者进行不同口语产出任务并采集被检测者的语音;S3:对所采集语音进行预处理;S4:提取预处理后的语音中和阿尔茨海默症相关的病理特征并将其输入训练好的深度置信网络模型进行训练得到优化特征;S5:将优化特征输入训练好的SVM分类器进行分类,分类结果即为筛查结果。

【技术特征摘要】
1.基于深度学习的阿尔茨海默症语音信号的筛查方法,其特征在于,包括步骤:S1:训练深度置信网络模型备用;S2:使被检测者进行不同口语产出任务并采集被检测者的语音;S3:对所采集语音进行预处理;S4:提取预处理后的语音中和阿尔茨海默症相关的病理特征并将其输入训练好的深度置信网络模型进行训练得到优化特征;S5:将优化特征输入训练好的SVM分类器进行分类,分类结果即为筛查结果。2.根据权利要求1所述的基于深度学习的阿尔茨海默症语音信号的筛查方法,其特征在于,所述步骤S2具体包括:测量现场噪音,排除噪声源,在噪声符合要求之后进行语音采集;语音采集过程中,对被测者进行不同口语产出任务,对语音进行标记整理。3.根据权利要求2所述的基于深度学习的阿尔茨海默症语音信号的筛查方法,其特征在于,所述步骤S2具体包括:测量现场噪音,排除噪声源,在噪声符合要求之后进行语音采集;语音采集过程中,对被测者进行不同口语产出任务,口语产出任务包括自我介绍、言语流畅性测试、图画描述、连续发元音,对语音进行标记整理。4.根据权利要求1所述的基于深度学习的阿尔茨海默症语音信号的筛查方法,其特征在于,所述步骤S3具体包括:对采集到的语音数据进行去噪,参数规整,预加重,加窗和分帧处理,获取语音帧序列。5.根据权利要求4所述的基于深度学习的阿尔茨海默症语音信号的筛查方法,...

【专利技术属性】
技术研发人员:周青顾明亮马勇朱祖德
申请(专利权)人:江苏师范大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1