【技术实现步骤摘要】
大数据背景下运动性构音障碍语音库的建立及分析方法
本专利技术涉及一种大数据背景下运动性构音障碍语音库的建立及分析方法。
技术介绍
(1)运动性构音障碍研究现状:运动性构音障碍(dysarthria)是指由于中枢神经系统或周围神经系统损害导致,肌肉的控制紊乱而形成的一组言语障碍。运动性构音障碍常表现为言语相关肌肉组织运动减慢、减弱、不精确、不协调,也可能影响到呼吸、共鸣、喉发声的控制、构音和韵律,临床上常简称为构音障碍。运动性构音障碍常见病因包括脑外伤、脑瘫、肌萎缩性侧索硬化、多发性硬化、脑卒中、帕金森病、脊髓小脑共济失调等。构音障碍根据神经解剖和言语声学特点可以分为弛缓型、痉挛型、失调型、运动过弱型、运动过强型和混合型。在与脑损伤相关的交流障碍中,构音障碍发病率高达54%。目前临床可以通过对嗓音、共鸣、韵律等方面的检查可从主观和客观两个方面反应构音障碍的言语声学特点,有利于提供针对性的治疗和全面科学地阐明构音障碍的言语声学病理机制。对于运动性构音障碍总体的发病率国内外研究报道均较少,Miller等对125例帕金森病患者研究显示,有69.6%的患者的言语清晰度均值比正常对照组低,其中51.2%的患者低一个标准差,表明在帕金森患者中构音障碍的发病率较高。Bogousslavsky等对1000例初次卒中患者进行筛选,发现有言语障碍的患者高达46%,其中12.4%确诊为构音障碍患者。Hartelius等研究也发现多发性硬化患者中构音障碍发病率为51%。由此可见构音障碍的发病率较高。构音障碍的评定,目前国内尚无 ...
【技术保护点】
1.一种大数据背景下运动性构音障碍语音库的建立及分析方法,包括以下步骤:/n步骤1、发音文本的设计;/n步骤2、语音录制;/n步骤3、语音文件的标注;/n步骤4、对语音文件的声学参数分析;/n步骤5、数据库管理系统的建立;/n步骤6、大数据技术的数据分析。/n
【技术特征摘要】
20200512 CN 202010395558X1.一种大数据背景下运动性构音障碍语音库的建立及分析方法,包括以下步骤:
步骤1、发音文本的设计;
步骤2、语音录制;
步骤3、语音文件的标注;
步骤4、对语音文件的声学参数分析;
步骤5、数据库管理系统的建立;
步骤6、大数据技术的数据分析。
2.根据权利要求1所述的大数据背景下运动性构音障碍语音库的建立及分析方法,其特征在于:所述步骤6中大数据技术的数据分析基于Hadoop平台的语音分类机制,具体包括如下分步骤:
步骤61、收集复数个患者语音文件,对语音进行音段切分和标注,构建语音数据库,对提取的声学参数进行分析,获取语音分类的有效特征;
步骤62、然后基于Hadoop平台,采用Map函数对大数据语音分类问题进行细分,用多节点并行、分布式地对子问题进行语音分类求解,得到相应的语音分类结果;
步骤63、最后利用Reduce函数对子问题的语音分类结果进行组合,以适应大数据语音分类的在线要求。
3.根据权利要求1或2所述的大数据背景下运动性构音障碍语音库的建立及分析方法,其特征在于:
所述步骤1中发音文本的设计包括发音文本的选择,所述发音文本的语料库的选择原则包括以下一种或多种:
a、语料库中的单字要求尽量包含所有的声韵现象,能够更好更方便的反映不同患者语音的音系特征;
b、语料库中的词汇依据汉语调查常用表为基础,所以能方便的与汉语普通话进行比较;
c、语料库中的句子主要是根据几个相关主题,与患者进行对话所得,所以更符合语音识别面对的真实情形;
d、语料库中的句子在内容和语义上都是完整的,所以能够尽可能的反映一个句子的韵律信息;
e、对三音子不进行归类的挑选,这样能够有效的解决训练数据稀疏的问题。
4.根据权利要求3所述的大数据背景下运动性构音障碍语音库的建立及分析方法,其特征在于:
所述步骤1中所述发音文本的设计还包括发音文本的编制,所述发音文本的编制原则包括以下一种或多种:
a、单字部分:将调查字表中列举的声母韵母以及声调的一些常用字作为本次语音库的主要录音所用语料;
b、词汇部分:至少以一个四千词词表为基础,根据原来关于相关音系的结论记录相关词语,力求能够全面反映其语音特点,包括音质和超音质特点,针对一些很有特色的语音现象,可增加例词来反映其特征;
c、语句材料部分:根据不同发音人的语言掌握程度决定语料数量,选取时既要保证语料的范围尽可能广,还需使其具有一定的代表性;
d、自然对话部分:日常生活为题,采...
【专利技术属性】
技术研发人员:马春,杜炜,金力,阚峻岭,
申请(专利权)人:安徽中医药大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。