一种特征增强的构音障碍语音处理方法技术

技术编号：36207962 阅读：19 留言：0更新日期：2023-01-04 12:03

本发明专利技术属于语音信号处理技术领域，具体涉及一种特征增强的构音障碍语音处理方法,包括以下步骤：S1、对原始信号进行快速傅里叶变换，计算得到其频谱信号；S2、对频谱信号进行经验模态分解，得到各个本征模式分解分量；S3、计算前m个本征模式分解分量的功率谱密度，得到功率谱特征向量；S4、对前m个本征模式分解分量分别进行快速沃尔什

全部详细技术资料下载

【技术实现步骤摘要】
一种特征增强的构音障碍语音处理方法

[0001]本专利技术属于语音信号处理
，具体涉及一种特征增强的构音障碍语音处理方法。

技术介绍

[0002]构音障碍是由中枢神经系统损伤引起的发音和运动障碍，这种言语功能障碍会影响个体声道和声带发声，从而影响患者语言表达能力和言语可懂度，这将会给患者的日常交流沟通造成非常严重的影响。随着信号处理技术发展，对病理语音的研究常使用一些语音信号的处理方法；同时，由于机器学习、深度学习的快速发展，医学领域的一些问题可和信号处理相关技术实现技术交叉融合，进行医工结合解决实际问题。
[0003]值得注意的是，特征在机器学习领域发挥着重要作用，因为它们代表了需要研究的对象，寻找更具有表征性、能够更好地代表被试特征信息的特征具有非常重大的意义，这将很大程度上提升模型分类识别性能。对于病理语音的研究，常常使用一些特征来表征病患信息，常见特征有基频、抖动、微光、谐波噪声比(HNR)、梅尔频率倒谱系数(MFCC)、线性预测系数(LPC)等等。目前，国内外有很多研究者致力于这一领域，Joshy和Rajan在MFCCs特征上使用DNN、CNN和LSTM等深度学习算法来检测TORGO和UA Speech数据集的构音障碍严重程度，并提出一种基于门控神经网络(GNN)的新方法用来改善声学和音调特征的集成情况；同时研究了GNN的贝叶斯估计，进一步提高了其鲁棒性。Juliette Millet和Neil Zeghidour使用TORGO数据集的原始波形的特征来检测构音障碍的严重程度。Abner Her...

【技术保护点】

【技术特征摘要】
1.一种特征增强的构音障碍语音处理方法，其特征在于，包括以下步骤：S1、对原始信号进行快速傅里叶变换，计算得到其频谱信号；S2、对频谱信号进行经验模态分解，得到各个本征模式分解分量；S3、计算前m个本征模式分解分量的功率谱密度，得到维度为m的功率谱特征向量；S4、对前m个本征模式分解分量分别进行快速沃尔什
‑
哈达玛变换得到沃尔什变换系数，然后提取各个沃尔什变换系数的统计学特征，得到维度为m
×
a的统计学特征向量；其中m和a为整数，a表示统计学特征的数量；S5、将所述功率谱特征向量和统计学特征向量组合，得到维度为m
×
(a+1)的组合特征向量。2.根据权利要求1所述的一种特征增强的构音障碍语音处理方法，其特征在于，所述步骤S4中，统计学特征包括均值、标准差、最大值、最小值、方差。3.根据权利要求1所述的一种特征增强的构音障碍语音处理方法，其特征在于，所述步骤S3中，功率谱密度的计算方法为：S301、将对应的本征模式分解分量进行分段处理得到多个分段信号；S302、对各个分段信号分别进行加窗预处理和快速傅里叶变换，得到对应的周期图；S303、根据各个分段信号对应的周期图计算功率谱。4.根据权利要求3所述的一种特征增强的构音障碍语音处理方法，其特征在于，所述周期图的计算公式为：其中，S
k
表示第...

【专利技术属性】
技术研发人员：段淑斐，朱婷，张雪英，卡米拉，孙颖，贾海蓉，
申请(专利权)人：太原理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人