【技术实现步骤摘要】
基于PSO动态搜索分类网络的帕金森语音识别方法及装置
[0001]本专利技术是一种基于PSO(粒子群优化算法)动态搜索分类网络结构的帕金森语音识别方法,涉及智慧医疗技术。
技术介绍
[0002]帕金森氏症是一种神经系统疾病,由大脑中产生多巴胺的细胞丧失引起,从而损害大脑功能。随着患者病情的加重,大脑和身体不同部位的协调会出现问题。近90%的帕金森氏症患者在早期就表现出发声障碍的症状,而且,帕金森病患者的语音信号与正常人相比有很大的差异和变化。因此,语音信号被用来辅助诊断帕金森。目前,帕金森语音分类常见的方法有支持向量机、随机森林、多层感知机、神经网络等等。
[0003]上述方法在针对某一类语音信号的帕金森分类上取得了较大进展,但是,这些方法大都是根据某一类语音信号提取语音信号常见特征,针对性的设置分类器,方法并不具备普适性。
技术实现思路
[0004]本专利技术所需要解决的问题在于不同语言、不同内容的语音信号给帕金森语音识别带来的困难,本专利技术提供一种基于PSO动态搜索分类网络结构的帕金森语音识别方法。
[0005]技术方案:为解决上述技术问题,本专利技术采用的技术方案为:
[0006]第一方面,提供一种帕金森语音识别方法,包括:
[0007]步骤(1)、获取帕金森患者的语音数据;
[0008]步骤(2)、对获取的语音数据进行剪辑处理,得到剪辑后的语音数据;
[0009]步骤(3)、对剪辑后的语音数据提取语音特征,得到语音特征数据集;
[001 ...
【技术保护点】
【技术特征摘要】
1.一种帕金森语音识别方法,其特征在于,包括:步骤(1)、获取帕金森患者的语音数据;步骤(2)、对获取的语音数据进行剪辑处理,得到剪辑后的语音数据;步骤(3)、对剪辑后的语音数据提取语音特征,得到语音特征数据集;步骤(4)、通过预设的动态搜索分类网络的参数,随机初始化生成分类网络粒子群;步骤(5)、利用语音特征数据集对分类网络粒子群进行迭代训练、更新,得到训练更新好的动态搜索分类网络模型;步骤(6)、将待识别的语音特征数据输入训练更新好的动态搜索分类网络模型,根据所述动态搜索分类网络模型的输出,确定帕金森语音识别结果。2.根据权利要求1所述的帕金森语音识别方法,其特征在于,获取帕金森患者的语音数据,包括:所述帕金森患者的语音数据,包括伦敦国王学院MDVR
‑
KCL早期和晚期帕金森患者语音数据集、健康对照者的语音数据集和/或意大利帕金森语音数据集;其中所述MDVR
‑
KCL早期和晚期帕金森患者语音数据集、健康对照者的语音数据集语言为英语,内容为两段文本的朗读语音;其中所述意大利帕金森语音数据集内容为单音节发音数据,包括
‘
a
’‘
i
’‘
e
’‘
o
’‘
u
’‘
ta
’‘
pa
’
音节的重复发音。3.根据权利要求1所述的帕金森语音识别方法,其特征在于,对获取的语音数据进行剪辑处理,包括:对于MDVR
‑
KCL早期和晚期帕金森患者和健康对照者的语音数据集,按照朗读文本的断句进行剪辑,同时剔除停顿的空白语音片段;对于意大利帕金森语音数据集,剪辑每个音节发音片段,剔除暂停过程中的空白语音片段。4.根据权利要求1所述的帕金森语音识别方法,其特征在于,对剪辑后的语音数据提取语音特征,得到语音特征数据集,包括:所述语音特征数据集中包括26个语音基本特征、梅尔倒谱系数特征和13个全局特征:使用Praat声学分析软件从每个语音信号中提取一组26个语音基本特征;基于短时傅里叶变换,使用梅尔滤波器组提取语音信号的梅尔倒谱系数特征;对于语音信号,提取包括平均值、中位数、均方根、平方、最大值、最小值、第一和第三个四分位数、四分位数范围、标准差、偏度和峰度13个全局特征。5.根据权利要求1所述的帕金森语音识别方法,其特征在于,通过预设的动态搜索分类网络的参数,随机初始化生成分类网络粒子群,包括:初始化种群大小为20,迭代次数为10,分类网络层数范围为[3,10],对于分类网络要求第一层必须是卷积层,最后一层必须是完全连接层,随机...
【专利技术属性】
技术研发人员:高浩,甘燕燕,徐枫,郭怡菁,袁杰,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。