一种构音障碍发音运动异常分布的统计分类方法技术

技术编号:20392747 阅读:48 留言:0更新日期:2019-02-20 04:00
本发明专利技术属于信息处理技术领域,具体是一种构音障碍发音运动异常分布的统计分类方法。解决了构音器官发音运动统计的问题,包括以下步骤,S100~绘制舌尖、舌中、舌根在前后、左右、上下三方向发音运动区间的分布图;S200~以25mm为阈值,计算大于该值的发音运动区间所占的比例;S300~通过对数正态分布对发音运动区间分布进行拟合;S400~通过正态分布进行拟合,以正态分布的2.58个标准差为阈值,分别计算构音障碍患者和正常人发音异常数据所占比例。本发明专利技术从舌部空间运动的前后、左右、上下三方向入手,通过对发音者三方向上发音运动区间分布进行研究,进而根据发音异常运动区间所占比例来进一步统计构音障碍患者和正常人。

【技术实现步骤摘要】
一种构音障碍发音运动异常分布的统计分类方法
本专利技术属于信息处理
,具体是一种构音障碍发音运动异常分布的统计分类方法。
技术介绍
随着信号处理技术的发展,特别是机器学习方法的跨学科应用,使得医学领域的科学问题可以和信号处理的技术交叉。病理语音学是要深入具体分析不同病症对应语音的声学特征和发音特征,不仅从理论上概括总结规律,同时提出不同针对性的策略和措施,以求在实际应用中帮助病患做好康复治疗。目前使用最广泛的病理语音数据库是麻省眼耳医院MEEI病理嗓音数据库和阿姆斯特丹大学的NKI-CCRT数据库,它们均记录了语音音频数据,而不含有与音频数据相对应的发音动作数据。多伦多大学计算机科学与语音语言病理学系联合医院开发的TORGO数据库记录了由三维电磁发音仪(3DElectro-magnetic-articulography,EMA)AG500录制的脑瘫或肌萎缩性脊髓侧索硬化症患者的音频和发音动作数据,且该数据库公开可用。EMA是专门用于采集微小动作数据的设备。它提供了解决语音学研究的运动学问题的科学方式,能够同步手机语音数据和运动轨迹数据,实时观测数据的测量和保存。目前病理语音的研究大多数从音频的声学特征入手,关于发音动作信息的研究也是从运动位移、运动速度、运动加速度等方面,关于统计分布的鲜有研究。
技术实现思路
本专利技术为了解决构音器官发音运动统计的问题,提供一种构音障碍发音异常运动区间分布的统计分类方法。本专利技术采取以下技术方案:一种构音障碍发音异常运动区间分布统计方法,包括以下步骤。S100~绘制舌尖、舌中、舌根在前后、左右、上下三方向发音运动区间的分布图。S101~计算每条发音动作数据的最大值和最小值:Xmaxj=max(Xj),j=1,...,n(1)Xminj=min(Xj),j=1,...,n(2)式(1)、(2)中,(Xmax1,Xmax2,…Xmaxn)T构成向量Xmax,表示每条数据的舌尖左右方向最大值的集合;(Xmin1,Xmin2,…Xmin)T构成向量Xmin,表示每条数据的舌尖左右方向最小值的集合。S102~发音者每条数据发音时的舌尖前后方向的运动区间I即:Ij=Xmaxj-Xminj,j=1,...,n(3)。S103~将发音运动区间分成若干小组,并计算组距,计算公式为:式中,b为计算所得的组距;g为确定的小组数。S104~统计发音运动区间落在相应小组内的频数,绘制成发音运动区间分布图。S200~以25mm为阈值,计算大于该值的发音运动区间所占的比例。S201~以25毫米为阈值,认为大于25毫米的发音运动区间为发音异常运动区间,计算发音异常运动区间的数量占总数的比例,式中,r为发音异常运动区间所占的比例;fn为发音异常运动区间的数量,n为发音运动区间的总数量。S202~统计构音障碍患者和正常人舌部发音异常运动区间所占百分比r、rc。S300~通过对数正态分布对发音运动区间分布进行拟合,具体步骤如下。S301~分别计算舌尖、舌中、舌根发音运动区间对数的均值和方差:式中Ij为第j条发音数据的舌尖左右方向的发音运动区间,n为发音数据量。S302~将均值μ和标准差σ带入式(8),计算其概率密度函数f(Ij),绘制概率密度曲线;式中μ和σ为变量对数的均值和标准差。S303~根据式(9)、式(10),分别计算舌尖、舌中、舌根发音运动区间的均值和标准差,式中Ij为第j条发音数据的舌尖左右方向的发音运动区间,n为发音数据量。统计舌部前后、左右、上下三方向相对应的均值与方差,进行对比分析。S400~取直方图中频数达到最大时的发音运动区间对数为平均值,以直方图的左半部分为标准,通过计算在左侧-2.58标准差的置信区间,发音数据正常的可信度达到99%,对称到右半部分的+2.58个标准差。最后以+2.58个标准差为阈值,分别计算构音障碍患者和正常人发音异常数据所占比例。S401~计算平均值μ1,由下式得:μ1=min(lnIj)+(p+1)*b(11)式中,p为直方图中频数最大的小组;b为频数直方图的组距。S402~计算平均值μ1左侧的标准差:S403~由正态分布的特性可得,数据落在置信区间(μ1-2.58σ1,μ1+2.58σ1)内的可信度达到99%,以平均值为对称轴,将左侧的标准差μ1-2.58*σ1,对称到右侧的μ1+2.58*σ1,计算大于μ1+2.58*σ1的数量n+2.58σ1占总量n的比例:统计舌尖、舌中、舌根的左右方向上构音障碍患者和正常人异常发音数据所占比例。与现有技术相比,本专利技术解决了传统的构音障碍患者诊断中缺少客观评估辅助的现状,从舌部空间运动的前后、左右、上下三方向入手,通过对发音者三方向上发音运动区间分布进行研究,进而根据发音异常运动区间所占比例来进一步统计构音障碍患者和正常人,为构音障碍的评估提供了客观有效的方法,帮助言语治疗师更深刻地了解患者的构音语音障碍,指导其制定出更科学更有效的康复方案。附图说明图1为构音障碍患者与正常人发音时舌尖前后方向的运动区间分布图;图2为构音障碍患者与正常人发音时舌尖左右方向的运动区间分布图;图3为构音障碍患者与正常人发音时舌尖上下方向的运动区间分布图;图4为舌尖前后方向发音运动区间的对数分布拟合图;图5为舌尖左右方向发音运动区间的对数分布拟合图;图6为舌尖上下方向发音运动区间的对数分布拟合图;图7为构音障碍患者舌尖左右方向发音运动区间对数的正态分布拟合图;图8为正常人舌尖左右方向发音运动区间对数的正态分布拟合图。具体实施方式结合以下具体实施例和附图,对本专利技术作进一步的详细说明。实施本专利技术的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本专利技术没有特别限制内容。本专利技术所针对的数据是由三维电磁发音仪录制的发音动作数据。电磁发音动作数据能够显示每个传感器距离发射器的欧氏距离,然后可以计算出XYZ坐标和两个角度以及测量、存储和显示传感器的位置,其中X表示前后方向,Y表示左右方向,Z表示上下方向。此处列出舌尖左右方向发音运动区间分布图的绘制步骤,其他计算过程相同。舌尖左右方向的第j条发音动作信息通过一个i维列向量Xj表示,i维表示录制第j条发音动作数据时根据采样率记录有i个位置节点,i∈N;1≤j≤n。本专利技术首先绘制发音运动区间的分布图,具体步骤如下:S100~绘制舌尖、舌中、舌根在前后、左右、上下三方向发音运动区间的分布图。S101~计算每条发音动作数据的最大值和最小值:Xmaxj=max(Xj),j=1,...,n(1)Xminj=min(Xj),j=1,...,n(2)式(1)、(2)中,(Xmax1,Xmax2,…Xmaxn)T构成向量Xmax,表示每条数据的舌尖左右方向最大值的集合;(Xmin1,Xmin2,…Xmin)T构成向量Xmin,表示每条数据的舌尖左右方向最小值的集合。S102~发音者每条数据发音时的舌尖前后方向的运动区间I即:Ij=Xmaxj-Xminj,j=1,...,n(3)。S103~将发音运动区间分成若干小组,并计算组距,计算公式为:式中,b为计算所得的组距;g为确定的小组数。S104~统计发音运动区间落在相应小组内的频数,绘制成发音运动区间分布图。基于TORGO数据库的同一文本文档来自技高网...

【技术保护点】
1.一种构音障碍发音运动异常分布的统计分类方法,其特征在于:包括以下步骤,S100~绘制舌尖、舌中、舌根在前后、左右、上下三方向发音运动区间的分布图;S200~以25mm为阈值,计算大于该值的发音运动区间所占的比例;S300~通过对数正态分布对发音运动区间分布进行拟合;S400~通过正态分布进行拟合,以正态分布的2.58个标准差为阈值,分别计算构音障碍患者和正常人发音异常数据所占比例。

【技术特征摘要】
1.一种构音障碍发音运动异常分布的统计分类方法,其特征在于:包括以下步骤,S100~绘制舌尖、舌中、舌根在前后、左右、上下三方向发音运动区间的分布图;S200~以25mm为阈值,计算大于该值的发音运动区间所占的比例;S300~通过对数正态分布对发音运动区间分布进行拟合;S400~通过正态分布进行拟合,以正态分布的2.58个标准差为阈值,分别计算构音障碍患者和正常人发音异常数据所占比例。2.根据权利要求1所述的构音障碍发音运动异常分布的统计分类方法,其特征在于:所述的S100包括以下步骤,S101~计算每条发音动作数据的最大值和最小值:Xmaxj=max(Xj),j=1,...,n(1)Xminj=min(Xj),j=1,...,n(2)式(1)、(2)中,(Xmax1,Xmax2,…Xmaxn)T构成向量Xmax,表示每条数据的舌尖左右方向最大值的集合;(Xmin1,Xmin2,…Xmin)T构成向量Xmin,表示每条数据的舌尖左右方向最小值的集合;S102~发音者每条数据发音时的舌尖前后方向的运动区间I即:Ij=Xmaxj-Xminj,j=1,...,n(3);S103~将发音运动区间分成若干小组,并计算组距,计算公式为:式中,b为计算所得的组距;g为确定的小组数;S104~统计发音运动区间落在相应小组内的频数,绘制成发音运动区间分布图。3.根据权利要求2所述的构音障碍发音运动异常分布的统计分类方法,其特征在于:所述的S200包括以下步骤,S201~以25毫米为阈值,认为大于25毫米的发音运动区间为发音异常运动区间,计算大于发音异常运动区间的频数占...

【专利技术属性】
技术研发人员:段淑斐张雪英闫密密
申请(专利权)人:太原理工大学
类型:发明
国别省市:山西,14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1