一种基于语音特征的痴呆早期评估方法及装置制造方法及图纸

技术编号:32651681 阅读:106 留言:0更新日期:2022-03-17 10:57
本发明专利技术公开了一种基于语音特征的痴呆早期评估方法及装置,为克服环境噪声干扰的问题,通过声音预处理模块(音量标准化、高通低通滤波、去除噪声等处理方法)增强所提取特征的鲁棒性。评估方法步骤和装置模块:1)通过语音采集模块录制语音,收集建立老年性痴呆病语音库和健康语音库;2)声音预处理模块(对语音信号进行音量标准化、高通低通滤波、去除噪声)得到较干净语音信号,接下来对语音信号进行特征提取(暂停和梅尔倒谱系数等特征);3)特征选择模块;4)数据平衡模块;5)训练模块(训练集上利用支持向量机算法训练老年性痴呆病语音和健康语音模型);6)分类预测模块(测试集上利用支持向量机分类方法进行分类预测),实现基于语音特征的痴呆早期评估;包含这些处理模块的装置即可实现基于语音特征的痴呆早期评估。置即可实现基于语音特征的痴呆早期评估。置即可实现基于语音特征的痴呆早期评估。

【技术实现步骤摘要】
一种基于语音特征的痴呆早期评估方法及装置


[0001]本专利技术涉及脑健康体感检测领域,具体涉及一种适用于痴呆早期评估的语音特征识别系统。

技术介绍

[0002]老年性痴呆是一种常见的神经退行性疾病,严重影响人类的健康。随着人口老龄化的加剧,老年性痴呆患者越来越多,并且有年轻化的趋势,老年性痴呆诊治形势日益严峻。随着时间的发展,该病症状越来越严重,并且不能彻底治愈,但早期干预和治疗能够缓解症状,提高患者生活质量。由于老年性痴呆起病隐匿,初期症状不明显,早期诊断困难,早期很容易漏诊和误诊。大部分患者从出现症状到临床确诊,平均需要几年甚至十几年的时间,误诊率很高。如果能够实现可靠的老年性痴呆早期评估,使患者能在早期接受治疗,在延缓其病情发展,提高其生活质量,减轻家庭和社会负担等方面具有重要的意义。
[0003]研究表明,超过90%的老年性痴呆患者具有语言功能障碍,随着病情加重这种症状越来越明显,表现为讲话速度变慢、音量变低、高次谐波频谱能量升高、声音震颤、音调降低、停顿较多较长等。由于语音信号采集方便,易于存储和传输,利用语音特征评估老年性痴呆病具有简单、无创、成本低、可远程实现、容易普及等优点,这一领域的研究引起了国内外众多学者的广泛关注。
[0004]以往利用语音评估老年性痴呆研究大多没有考虑噪声影响,评估准确率可达78%以上。但在现实环境下,语音信号采集过程中不可避免地受到环境噪声的干扰,影响语音特征参数的准确性,导致评估性能下降。
[0005]本专利技术针对老年性痴呆语音评估中的噪声干扰问题,通过语音预处理模块实现音量标准化、高通低通滤波、去除噪声,特征提取模块提取梅尔倒谱系数、PLP、基频特征提取等措施提高特征的鲁棒性,特征选择模块使用SFS方法实现特征降维,数据平衡模块实现上采样、下采样、SMOTE等方法平衡数据,然后通过分类预测模块利用支持向量机(Support Vector Machine,SVM)分类方法进行分类,实现老年性痴呆语音评估,给出分类预测结果。

技术实现思路

[0006]本专利技术所要解决的技术问题是克服了老年性痴呆语音评估中易受噪声干扰的问题,提供了一种基于语音特征的老年性痴呆早期评估方法及装置。
[0007]为解决上述技术问题,本专利技术是采用如下技术方案实现的:所述的基于语音特征的老年性痴呆的早期评估方法及装置包括步骤及模块如下:
[0008]1)通过语音采集模块录制语音,建立老年性痴呆病语音库和健康语音库;
[0009]相对安静环境和一定噪声环境中的老年性痴呆病语音库和健康语音库均来自北京老年脑健康数据库,采用pad录制,其中老年性痴呆病语音500多个,健康语音200多个;
[0010]老年性痴呆病语音和健康语音均转换为16kHz、16bit、单声道的wav格式;此处得到相对安静环境和一定噪声环境中的老年性痴呆病语音库和健康语音库;
Python interface to Praat.Journal of Phonetics,71,1-15.https://doi.org/10.1016/j.wocn.2018.07.001
[0036]localJitter=call(pointProcess,

Get jitter(local)

,0,0,0.0001,0.02,1.3)
[0037]localabsoluteJitter=call(pointProcess,

Get jitter(local,absolute)

,0,0,0.0001,0.02,1.3)
[0038]rapJitter=call(pointProcess,

Get jitter(rap)

,0,0,0.0001,0.02,1.3)
[0039]ppq5Jitter=call(pointProcess,

Get jitter(ppq5)

,0,0,0.0001,0.02,1.3)
[0040]ddpJitter=call(pointProcess,

Get jitter(ddp)

,0,0,0.0001,0.02,1.3)
[0041]localShimmer=call([sound,pointProcess],

Get shimmer(local)

,0,0,0.0001,0.02,1.3,1.6)
[0042]localdbShimmer=call([sound,pointProcess],

Get shimmer(local_dB)

,0,0,0.0001,0.02,1.3,1.6)
[0043]apq3Shimmer=call([sound,pointProcess],

Get shimmer(apq3)

,0,0,0.0001,0.02,1.3,1.6)
[0044]aqpq5Shimmer=call([sound,pointProcess],

Get shimmer(apq5)

,0,0,0.0001,0.02,1.3,1.6)
[0045]apq11Shimmer=call([sound,pointProcess],

Get shimmer(apq11)

,0,0,0.0001,0.02,1.3,1.6)
[0046]ddaShimmer=call([sound,pointProcess],

Get shimmer(dda)

,0,0,0.0001,0.02,1.3,1.6)
[0047]minF0=call(broad_pitch,

Get minimum

,0,0,

hertz



Parabolic

)#get min pitch;maxF0=call(broad_pitch,

Get maximum

,0,0,

hertz



Parabolic

)#get max pitch
[0048]meanF0=call(pitch,

Get mean

,0,0,

hertz

)#get mean pitch
[0049]stdevF0=call(pitch,

Get standard dev本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语音特征的痴呆早期评估方法及装置,其特征在于,所述的基于语音特征的老年性痴呆早期评估方法及装置包括步骤及模块如下:1)通过语言采集模块录制语音,收集建立老年性痴呆病语音库和健康语音库相对安静环境和一定噪声环境中的老年性痴呆病语音库和健康语音库均来自北京老年脑健康数据库,采用pad录制,其中不同阶段老年性痴呆病语音500多个,健康语音200多个;老年性痴呆病和健康语音均转换为16kHz、16bit、单声道的wav格式;此处得到相对安静环境和一定噪声环境中的老年性痴呆病语音库和健康语音库;2)通过语音预处理模块对语音信号进行音量标准化、高通低通滤波、去除噪声,和梅尔倒谱系数、音素数、语速、暂停/总时长、平均暂停时长、hnr、Jitter、Shimmer等特征提取,并输出给下一模块;3)特征选择模块;过多特征反而导致机器学习效果下降,所以需要做特征选择,选择出分类效果最好的特征子集,并输出给下一模块;4)数据平衡模块;健康语音和非健康语音的个数不同,这就是数据不平衡,对于机器学习来说,平衡的数据能达到较好的分类效果,所以需要做数据平衡;5)训练模块,训练集上利用SVM训练老年性痴呆病语音和健康语音模型;6)分类预测模块,测试集上利用上一模块生成的模型进行分类预测,实现老年性痴呆病的语音评估,输出分类预测结果。SVM分类方法利用LIBSVM工具箱中Python语言实现,利用步骤5)得到的语音模型,调用SVM.predict()函数,利用test测试集中的音频文件进行测试,得到老年性痴呆病语音分类结果,即为老年性痴呆病的语音评估结果。2.按照权利要求1所述的基于语音特征的老年性痴呆病的语音评估方法及装置,其特征在于,所述的语音预处理及特征提取模块是指:音量标准化;高通低通滤波;利用低通、高通滤波器滤除50Hz以下、8000Hz以上的语音信号部分;去除噪声;先采集噪声样本,再通过噪声滤波器进行滤波,得到较干净语音;特征提取;计算梅尔倒谱系数统计特征、音素数、语速、暂停/总时长、平均暂停时长、hnr、Jitter、Shimmer等。3.按照权利要求2所述的基于语音特征的老年...

【专利技术属性】
技术研发人员:李喜悦
申请(专利权)人:北京脑智蓝海科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1