【技术实现步骤摘要】
一种用于失语症患者康复训练专用的语音识别方法
本专利技术涉及语音识别
,尤其涉及一种用于失语症患者康复训练专用的语音识别方法。
技术介绍
失语症是一种后天获得性神经语言障碍,表现为患者产生或理解语言的能力受到损害,包括听、说、读、写四个方面。研究发现,失语症患者的生活质量非常差,排名倒数第一,紧随其后的才是癌症和老年痴呆症患者。为了消除或减轻这种影响,失语症患者和他们的护理人员积极寻求康复治疗。失语症的主要康复手段为言语训练法,然而,这是一个资源密集型的过程,在评估和治疗中,至少需要一位语言病理学家。这一要求很难满足,因为失语症群体数量庞大,而且医疗资源有限。针对这种情况,计算机辅助治疗可以起到很好分担治疗压力的作用。但是,计算机辅助治疗失语症主要流行于欧美国家,国内的相关研究工作比较陈旧且为数不多。本专利技术的目的是训练一个失语症患者的自动语音识别模型,以支持患者的康复训练和辅助交流,本专利技术满足世界卫生组织提出的家庭康复和早期支持出院(earlysupporteddischarge,ESD)计划。针对失语 ...
【技术保护点】
1.一种用于失语症患者康复训练专用的语音识别方法,其特征在于,包括以下步骤:/n步骤1:录制包含失语症患者和健康被试者的语音材料;/n步骤2:将所述语音材料中的语音信号转换成特征矩阵,所述特征矩阵的大小为n*51,其中n为语音信号个数,51为信号特征维度,包括2维时域特征、3维频域特征、39维倒谱域特征、7维图像特征;/n步骤3:使用特征选择确认使用所述特征矩阵得到最优结果;/n步骤4:在将所述特征矩阵输入机器学习算法支持向量机训练所述语音识别模型之前,进行z-score数据标准化处理;/n步骤5:将所述特征矩阵输入机器学习算法支持向量机中进行学习,构建出用于失语症患者言语 ...
【技术特征摘要】
1.一种用于失语症患者康复训练专用的语音识别方法,其特征在于,包括以下步骤:
步骤1:录制包含失语症患者和健康被试者的语音材料;
步骤2:将所述语音材料中的语音信号转换成特征矩阵,所述特征矩阵的大小为n*51,其中n为语音信号个数,51为信号特征维度,包括2维时域特征、3维频域特征、39维倒谱域特征、7维图像特征;
步骤3:使用特征选择确认使用所述特征矩阵得到最优结果;
步骤4:在将所述特征矩阵输入机器学习算法支持向量机训练所述语音识别模型之前,进行z-score数据标准化处理;
步骤5:将所述特征矩阵输入机器学习算法支持向量机中进行学习,构建出用于失语症患者言语康复的语音识别模型;
步骤6:将待识别语音转换为所述特征矩阵,使用所述语音识别模型预测识别结果。
2.根据权利要求1所述的用于失语症患者康复训练专用的语音识别方法,其特征在于,所述步骤2将所述语音信号转换成特征矩阵的步骤包括:
步骤2.1:使用MATLAB函数audioDatastore读取所述语音信号,获得语音标签和采样率,所述语音标签的形式为n*1向量,n为语音信号个数;
步骤2.2:获取时域特征,检测所述语音信号中的时域波形图,设置幅度阈值LCThreshold为0.05,提取语音信号的过零率;使用MATLAB函数F_pitch计算出语音的基音频率;
步骤2.3:获取频域特征,检测语音信号的频谱图及其包络,提取包络的前三个峰值;
步骤2.4:获取倒谱域特征,使用MATLAB函数mfcc计算出语音的倒谱域特征,其中梅尔倒谱系数的第一维使用信号能量的对数值替代;
步骤2.5:获取图像特征,使用短时...
【专利技术属性】
技术研发人员:唐以廷,李有存,方强,穆罕默德,
申请(专利权)人:汕头大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。