当前位置: 首页 > 专利查询>兰州大学专利>正文

基于语音特征与机器学习的抑郁症自动评估系统和方法技术方案

技术编号:15475661 阅读:295 留言:0更新日期:2017-06-02 16:25
本发明专利技术提供一种基于语音特征与机器学习的抑郁症自动评估系统和方法,基于语音处理、特征提取、机器学习技术,寻找语音特征与抑郁症之间的联系,为抑郁症的临床诊断提供客观参考依据。本发明专利技术的系统包括(a)语音采集录音模块,用于记录被试者在不同情绪语料刺激下的语音信息;(b)语音特征计算模块,用于计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用于确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,依据机器学习模块确定的有效特征提取方式以及训练的分类器分类模式,将被试者有效语音特征进行抑郁程度分类。

Automatic evaluation system and method for depression based on speech features and machine learning

The invention provides a voice features and machine learning based on the depression automatic evaluation system and method of speech processing, feature extraction, machine learning technique based on the search between speech feature and depression, and provide objective reference for clinical diagnosis of depression. The system of the invention consists of (a) voice recording module for recording the subjects in different emotional corpus under the stimulation of voice information; (b) speech feature calculation module for calculating the acoustic characteristics of speech; (c) speech database module, which is used for speech feature related data validity analysis, classifier training optimization system classification rate; (d) machine learning module, used to determine the effective feature extraction method, and training for automatically evaluating classifier; (E) automatic evaluation module, based on the machine learning module determines the effective feature extraction methods and training classification model, the participants were effective phonetic features depression classification.

【技术实现步骤摘要】
基于语音特征与机器学习的抑郁症自动评估系统和方法
本专利技术涉及计算机辅助医疗诊断
,特别是涉及一种基于语音特征与机器学习的抑郁症自动评估系统和方法。
技术介绍
抑郁症是一种普遍的心理疾病,影响着全世界约3.5亿人,世界卫生组织(WorldHealthOrganization,WHO)预测到2020年抑郁症将成为全球第二大主要病因,因此找到一种有效的评估抑郁症的方法很有必要。目前,抑郁症的诊断和疗效评估缺少客观的测量方法和工具,主要依靠家属供史、患者自述以及临床量表等主观评估方法,从而造成早期情感障碍识别困难,患者常常因此失去最佳治疗时机。随着语音信号分析与处理技术的发展,尤其是线性预测技术在语音处理中的应用,基音频率、共振峰、线性预测系数、线性预测倒谱系数、Mel频率倒谱系数等语音特征参数被证实与情感(尤其是抑郁症状)密切相关,因此,可以通过对用户语音信号特征的分析,为抑郁症的临床诊断提供一种基于被试实际表现的客观参考。
技术实现思路
本专利技术提供一种基于语音特征与机器学习的抑郁症自动评估系统和方法,基于语音处理、特征提取、机器学习技术,通过寻找语音特征与抑郁症之间的联系,从而实现以非侵入式的方式客观评估被试是否抑郁的目的。本专利技术的技术方案是:1.一种基于语音特征与机器学习的抑郁症自动评估系统,其特征在于,包括(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息;(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。2.所述语音采集录音模块包括录音设备,采集设备有电脑控制端、噪声计、监听耳机、音箱、麦克风、声卡、防喷罩、话筒支架;所述监听耳机、音箱、麦克风、声卡均连接至电脑;录音设备采用NEUMANNTLM102麦克风和采样率为44.1kHz、数据长度为24位的RMEFIREFACEUCX声卡;采集的录音数据以.WAV格式保存。3.所述语音特征计算模块包含预处理模块,所述预处理模块包括依次连接的预加重、降噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块采用k值为0.97的预加重滤波器,所述滤波模块采用通带频率为60~4500Hz的滤波器。4.所述机器学习模块包括分类器,使用的分类器模型为支持向量机(SupportVectorMachine,SVM);SVM使用LIBSVM来实现,选取的核函数为RBF(RadialBasisFunction)。5.所述语音数据库模块运行在本系统的计算机上,用MicrosoftSQLServer实现;包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据库只保存经过医生诊断的被试数据。6.一种基于语音特征与机器学习的抑郁症自动评估方法,其特征在于,包括以下步骤:1)语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同时,使用录音设备记录被试者的语音信息;2)语音特征计算获取语音特征集:语音样本通过预处理后,计算语音的声学特征;将经过医生诊断的语音声学特征,包含诊断结果一起存入语音数据库;没有经过医生诊断的被试语音样本则进入步骤4);3)依据存入语音数据库的语音声学特征进行机器学习,确定语音有效特征提取方式,训练用于自动评估的分类器;4)提取有效特征并进行分类得出评估结论:提取出被试语音样本在评估抑郁症过程中最有效的语音特征,即有效特征;并通过训练好的分类器对提取的有效特征进行分类,实现依据输入的语音样本自动评估被试者的抑郁程度。7.所述步骤1)中,包括以下步骤:首先测量现场噪音,排除噪声源,在噪声符合要求之后,开始语音采集;语音采集过程中分别施以不同的情绪语料刺激,包括“语音问答”、“文本朗读”、“图片描述”三个不同的实验情境。8.所述步骤2)中,包括语音声学特征计算的步骤:第一步,将语音切分为帧,在单个语音帧中计算出局部声学特征;第二步,在多个语音帧之间,计算出统计学特征;第三步,若是已经过医生诊断的被试,将该被试的所有语音特征和人工诊断结果存入语音数据库;所述的特征提取算法包括但不限于:共振峰计算、有声段检测、MFCC、TEO、HNR、SNR、PPQ、APQ。9.所述步骤3)中,包括特征有效性分析与分类器训练的步骤:第一步,使用语音样本库中的已有人工诊断结论的数据,先采用最小冗余最大相关的方式,去掉明显不相关的特征,从语音声学特征计算出的特征集中初步筛选出一个特征的子集,作为待选特征集;第二步,在待选特征集中,排除一个特征后,用剩余特征训练分类器,若分类率明显降低,则说明该特征有效,并重复第二步;多次循环,对待选特征集进行至少一次的遍历之后,保留下来的特征,即构成有效特征集;有效特征集包含的特征即为有效特征;通过所述步骤最终训练出的分类器,即为用于自动评估时使用的分类器。10.所述步骤4)中,包括自动诊断的步骤:第一步,将没有人工诊断结果的被试语音样本,按照步骤3)确定的有效特征提取方式,计算出有效特征;第二步,将有效特征输入由步骤3)训练好的分类器,由分类器进行抑郁程度的分类;所述分类是指以两种标签:正常、抑郁进行分类。本专利技术的技术效果:本专利技术提供的一种基于语音特征与机器学习的抑郁症自动评估系统和方法,是结合了语音信号处理、特征计算与提取、模式识别的,具有一定学习能力的抑郁症自动筛查系统和方法。基于语音处理、特征提取、机器学习等技术,通过对用户语音信号特征的分析,通过语音采集、特征计算,并结合医生的诊断结论,抑郁症量表评分之后,能够通过寻找语音特征与抑郁症之间的联系,通过非侵入的方式,实现自动评估抑郁症的功能,可以为临床诊断提供基于客观标准的参考。附图说明图1是本专利技术的系统总体框架示意图。图2是本专利技术的方法流程示意图。图3是语音采集流程示意图。图4是语音预处理流程示意图。图5是语音声学特征计算和特征提取流程示意图。图6是特征有效性分析与分类器训练流程示意图。具体实施方式以下结合附图对本专利技术的实施例作进一步详细说明。图1是本专利技术的系统总体框架示意图。一种基于语音特征与机器学习的抑郁症自动评估系统,包括(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息;(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。其中,语音特征计算模块包含预处理模块,预处理模块包括依次连接的预加重、降噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重本文档来自技高网...
基于语音特征与机器学习的抑郁症自动评估系统和方法

【技术保护点】
一种基于语音特征与机器学习的抑郁症自动评估系统,其特征在于,包括(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息;(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。

【技术特征摘要】
1.一种基于语音特征与机器学习的抑郁症自动评估系统,其特征在于,包括(a)语音采集录音模块,用于对被试者施以不同的情绪语料刺激的同时,记录被试者的语音信息;(b)语音特征计算模块,用于对采集的语音信号进行预处理后,计算语音的声学特征;(c)语音数据库模块,包含用于语音特征有效性分析、分类器训练优化、系统分类率的相关数据;(d)机器学习模块,用语音数据库的数据进行语音特征与抑郁症的相关性分析,以确定有效特征的提取方式,并训练用于自动评估的分类器;(e)自动评估模块,提取被试者有效语音特征并进行抑郁程度分类,实现依据输入的语音样本自动评估被试者的抑郁程度。2.根据权利要求1所述的系统,其特征在于,所述语音采集录音模块包括录音设备,采集设备有电脑控制端、噪声计、监听耳机、音箱、麦克风、声卡、防喷罩、话筒支架;所述监听耳机、音箱、麦克风、声卡均连接至电脑;录音设备采用NEUMANNTLM102麦克风和采样率为44.1kHz、数据长度为24位的RMEFIREFACEUCX声卡;采集的录音数据以.WAV格式保存。3.根据权利要求1所述的系统,其特征在于,所述语音特征计算模块包含预处理模块,所述预处理模块包括依次连接的预加重、降噪、滤波模块,对采集的语音信号依次进行预加重、降噪和滤波处理;所述预加重模块采用k值为0.97的预加重滤波器,所述滤波模块采用通带频率为60~4500Hz的滤波器。4.根据权利要求1所述的系统,其特征在于,所述机器学习模块包括分类器,使用的分类器模型为支持向量机(SupportVectorMachine,SVM);SVM使用LIBSVM来实现,选取的核函数为RBF(RadialBasisFunction)。5.根据权利要求1所述的系统,其特征在于,所述语音数据库模块运行在本系统的计算机上,用MicrosoftSQLServer实现;包含的数据为:语音文件的语音特征、人工诊断标签、分类器分类标签,该数据库只保存经过医生诊断的被试数据。6.一种基于语音特征与机器学习的抑郁症自动评估方法,其特征在于,包括以下步骤:1)语音信息采集录音获取语音样本:通过对被试者施以不同的情绪语料刺激的同时,使用录音设备记录被试者的语音信息;2)语音特征计算获取语音特征集:语音样本通过预处理后...

【专利技术属性】
技术研发人员:胡斌刘振宇康环宇
申请(专利权)人:兰州大学
类型:发明
国别省市:甘肃,62

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1