大数据背景下运动性构音障碍语音库的建立及分析方法技术

技术编号:27940018 阅读:70 留言:0更新日期:2021-04-02 14:21
本发明专利技术涉及一种大数据背景下运动性构音障碍语音库的建立及分析方法,包括以下步骤:发音文本的设计;语音录制;对语音文件的参数分析;数据库管理系统的建立的建立;大数据技术的数据分析。本发明专利技术旨在研究神经系统疾病引起的运动性构音障碍的患者语音特性,依托于开放网络平台的优势,可以实现覆盖大规模群体的测量以及相关信息的收集,实现普通话、方言、健康人语音、患者语音等语音库的建立,并在此基础上,建立满足运动性构音障碍患者病情诊断的词库。

【技术实现步骤摘要】
大数据背景下运动性构音障碍语音库的建立及分析方法
本专利技术涉及一种大数据背景下运动性构音障碍语音库的建立及分析方法。
技术介绍
(1)运动性构音障碍研究现状:运动性构音障碍(dysarthria)是指由于中枢神经系统或周围神经系统损害导致,肌肉的控制紊乱而形成的一组言语障碍。运动性构音障碍常表现为言语相关肌肉组织运动减慢、减弱、不精确、不协调,也可能影响到呼吸、共鸣、喉发声的控制、构音和韵律,临床上常简称为构音障碍。运动性构音障碍常见病因包括脑外伤、脑瘫、肌萎缩性侧索硬化、多发性硬化、脑卒中、帕金森病、脊髓小脑共济失调等。构音障碍根据神经解剖和言语声学特点可以分为弛缓型、痉挛型、失调型、运动过弱型、运动过强型和混合型。在与脑损伤相关的交流障碍中,构音障碍发病率高达54%。目前临床可以通过对嗓音、共鸣、韵律等方面的检查可从主观和客观两个方面反应构音障碍的言语声学特点,有利于提供针对性的治疗和全面科学地阐明构音障碍的言语声学病理机制。对于运动性构音障碍总体的发病率国内外研究报道均较少,Miller等对125例帕金森病患者研究显示,有69.6%的患者的言语清晰度均值比正常对照组低,其中51.2%的患者低一个标准差,表明在帕金森患者中构音障碍的发病率较高。Bogousslavsky等对1000例初次卒中患者进行筛选,发现有言语障碍的患者高达46%,其中12.4%确诊为构音障碍患者。Hartelius等研究也发现多发性硬化患者中构音障碍发病率为51%。由此可见构音障碍的发病率较高。构音障碍的评定,目前国内尚无统一的评定方法,运动性构音障碍更无专门评定标准,多数采用Frenchay构音障碍评价法或改良法和中国康复研究中心构音障碍检查表,由临床医师或康复科医师检查、评分、记录、评价构音障碍程度、类型。(2)国内语音库研究现状:随着信息技术与计算机科学的发展,语音技术使机器行为与人类自然语言的交互成为可能,不论是语音合成、语音识别还是语音辨认研究,都必定依靠于后端优秀语音语料库的建设。目前国外语音库的发展较为成熟,中国的语音库研究也已在近十几年间突飞猛进,语音库的研究与建立已在不同的语言和文化语境中落地。但是针对运动性构音障碍语音库的建设目前还处于研究状态。国内的构音语音功能评估研究主要集中在主观评估方面,而且只有少数的研究者将构音与语音的概念有所区分。黄昭鸣等提出了《汉语构音能力测验词表》,该词表包含50个字,言语康复师通过评价被试的50个字的构音语音,能够全面评价被试对21个声母和4种声调的构音能力,同时,通过18项音位对比、37个最小语音对来评估被试的音位对比能力。陈三定等人对50名聋儿进行了汉语普通话声母、韵母和声调的评价,揭示了说汉语普通话的聋儿构音语音的发展规律,还进一步提出了及早、顺序、容错和巩固”的言语康复教育原则。华东师范大学的张晶博士研究了听障儿童在个辅音构音时的主要错误走向,分析成因,并相应的提出了听障儿童辅音音位治疗框架。(3)大数据在医疗领域研究现状:目前,对大数据定义比较流行的是:超过典型数据库软件工具所能撷取、储存、处理和分析能力的资料。大数据区别于超大规模数据、海量数据等传统数据概念,其具有四个基本特征:大量、多样、时效、价值。KayyaliB等研究了大数据在美国医疗行业的影响,指出随着时间推移,大数据对医疗行业的价值将越来越显著。目前医疗领域内的大数据主要来自制药企业,临床诊断数据,患者就医数据,健康管理、社交网络数据。例如药物研发是一个相对密集的过程,即使对中小型企业而言,一项药物研发的数据也在TB以上;医院的数据每天增长也非常快,一个病人的双源CT检查一次成像在3000张,大概产生1.5GB影像资料,一个标准病理检查图像有将近5GB图像,加上患者就医、电子病历等数据,每天都在快速增长。基于海量大数据分析的研究方法引发了人们对于科学方法论的思考。研究无需直接接触研究对象,而通过直接分析和挖掘海量数据便可获得新的研究发现,这或许催生了一种新的科研模式。语音语料库的建立是一个繁琐复杂的问题,对于语音语料库的后期完善还有待改进的问题,例如充分利用现有的词间变调规则,尽量体现变调和轻声的实际情况。对于语料的不足,可以在预处理环节提高现有语料利用率。鉴于以上原因,语音库应采取开放型数据库,以便可以随时添加、修改,以便完善该数据库。由于语音情况不尽相同,因而具体的语音语料库的建立也会碰到各种各样的困难,我们在这里所讨论的问题,只是对于建立语音语料库的一种探讨,希望可以为语音的研究提供数据支持,为更好的发展语言,完善语音语料库起着重要作用。此外,数据量大毫无疑问是网络大数据分析技术的一大优势,但如何保证海量数据的质量,以及如何实现对海量数据进行清洗、管理和分析等问题,也成为本课题研究的一大技术难点。海量的网络大数据具有多源异构、交互性、时效性、突发性和高噪声等特点,因而导致了网络大数据虽然价值巨大但噪声也大,价值密度低的特征。这对保证网络大数据分析研究中的数据质量则构成了巨大挑战。
技术实现思路
本专利技术设计了一种大数据背景下运动性构音障碍语音库的建立及分析方法,其解决的技术问题是数据量大毫无疑问是网络大数据分析技术的一大优势,但如何保证海量数据的质量,以及如何实现对海量数据进行清洗、管理和分析等问题,也成为一大技术难点。为了解决上述存在的技术问题,本专利技术采用了以下方案:一种大数据背景下运动性构音障碍语音库的建立及分析方法,包括以下步骤:步骤1、发音文本的设计;步骤2、语音录制;步骤3、语音文件的标注;步骤4、对语音文件的声学参数分析;步骤5、数据库管理系统的建立;步骤6、大数据技术的数据分析。优选地,所述步骤6中大数据技术的数据分析基于Hadoop平台的语音分类机制,具体包括如下分步骤:步骤61、收集复数个患者语音文件,对语音进行音段切分和标注,构建语音数据库,对提取的声学参数进行分析,获取语音分类的有效特征;步骤62、然后基于Hadoop平台,采用Map函数对大数据语音分类问题进行细分,用多节点并行、分布式地对子问题进行语音分类求解,得到相应的语音分类结果;步骤63、最后利用Reduce函数对子问题的语音分类结果进行组合,以适应大数据语音分类的在线要求。优选地,所述步骤1中发音文本的设计包括发音文本的选择,所述发音文本的语料库的选择原则包括以下一种或多种:a、语料库中的单字要求尽量包含所有的声韵现象,能够更好更方便的反映不同患者语音的音系特征;b、语料库中的词汇依据汉语调查常用表为基础,所以能方便的与汉语普通话进行比较;c、语料库中的句子主要是根据几个相关主题,与患者进行对话所得,所以更符合语音识别面对的真实情形;“几个相关主题”包括日常生活主题或病史主题,例如询问首次发病时间及病史情况。d、语料库中的句子在内容和语义上都是完整的,所以能够尽可能的反映一个句子的韵律信息;e、对三音子不进行归类的挑选,这样能够有效的解决本文档来自技高网
...

【技术保护点】
1.一种大数据背景下运动性构音障碍语音库的建立及分析方法,包括以下步骤:/n步骤1、发音文本的设计;/n步骤2、语音录制;/n步骤3、语音文件的标注;/n步骤4、对语音文件的声学参数分析;/n步骤5、数据库管理系统的建立;/n步骤6、大数据技术的数据分析。/n

【技术特征摘要】
20200512 CN 202010395558X1.一种大数据背景下运动性构音障碍语音库的建立及分析方法,包括以下步骤:
步骤1、发音文本的设计;
步骤2、语音录制;
步骤3、语音文件的标注;
步骤4、对语音文件的声学参数分析;
步骤5、数据库管理系统的建立;
步骤6、大数据技术的数据分析。


2.根据权利要求1所述的大数据背景下运动性构音障碍语音库的建立及分析方法,其特征在于:所述步骤6中大数据技术的数据分析基于Hadoop平台的语音分类机制,具体包括如下分步骤:
步骤61、收集复数个患者语音文件,对语音进行音段切分和标注,构建语音数据库,对提取的声学参数进行分析,获取语音分类的有效特征;
步骤62、然后基于Hadoop平台,采用Map函数对大数据语音分类问题进行细分,用多节点并行、分布式地对子问题进行语音分类求解,得到相应的语音分类结果;
步骤63、最后利用Reduce函数对子问题的语音分类结果进行组合,以适应大数据语音分类的在线要求。


3.根据权利要求1或2所述的大数据背景下运动性构音障碍语音库的建立及分析方法,其特征在于:
所述步骤1中发音文本的设计包括发音文本的选择,所述发音文本的语料库的选择原则包括以下一种或多种:
a、语料库中的单字要求尽量包含所有的声韵现象,能够更好更方便的反映不同患者语音的音系特征;
b、语料库中的词汇依据汉语调查常用表为基础,所以能方便的与汉语普通话进行比较;
c、语料库中的句子主要是根据几个相关主题,与患者进行对话所得,所以更符合语音识别面对的真实情形;
d、语料库中的句子在内容和语义上都是完整的,所以能够尽可能的反映一个句子的韵律信息;
e、对三音子不进行归类的挑选,这样能够有效的解决训练数据稀疏的问题。


4.根据权利要求3所述的大数据背景下运动性构音障碍语音库的建立及分析方法,其特征在于:
所述步骤1中所述发音文本的设计还包括发音文本的编制,所述发音文本的编制原则包括以下一种或多种:
a、单字部分:将调查字表中列举的声母韵母以及声调的一些常用字作为本次语音库的主要录音所用语料;
b、词汇部分:至少以一个四千词词表为基础,根据原来关于相关音系的结论记录相关词语,力求能够全面反映其语音特点,包括音质和超音质特点,针对一些很有特色的语音现象,可增加例词来反映其特征;
c、语句材料部分:根据不同发音人的语言掌握程度决定语料数量,选取时既要保证语料的范围尽可能广,还需使其具有一定的代表性;
d、自然对话部分:日常生活为题,采...

【专利技术属性】
技术研发人员:马春杜炜金力阚峻岭
申请(专利权)人:安徽中医药大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1