当前位置: 首页 > 专利查询>四川大学专利>正文

基于递归图分析的腭裂语音鼻漏气的识别方法技术

技术编号:20122429 阅读:52 留言:0更新日期:2019-01-16 12:53
本发明专利技术公开了一种基于递归图分析的腭裂语音鼻漏气的识别方法,涉及语音信号处理领域。该检测方法包括(1)语音信号预处理,对输入的语音信号进行降采样、归一化分帧、预加重及幅值归一化;(2)对预处理后的语音信号求取语音信号的递归图和矩阵递归图;(3)针对递归图做趋势分析;(4)针对递归图直接做区域分块处理,对信号递归图做矩阵处理;(5)对递归图进行图像处理,将格式转换后的图像矩阵,依次进行二值化处理和两次特定结构模板的滤波处理;(6)利用分类器对信号进行分类识别,得到自动识别结果。相比于现有技术,检测结果客观准确,实现较高程度的自动测量,在临床上对腭裂语音鼻漏气的数字化评估提供可靠的参考数据,符合精准医疗的发展需求,进行更加准确有效的信号分类识别。

A Recognition Method of Voice Nasal Leakage in Cleft Palate Based on Recursive Graph Analysis

The invention discloses a recognition method of cleft palate speech nasal leakage based on recursive graph analysis, which relates to the field of speech signal processing. The detection method includes: (1) speech signal pre-processing, descending sampling, normalized framing, pre-emphasis and amplitude normalization of the input speech signal; (2) extracting the recursive graph and matrix recursive graph of the speech signal from the pre-processed speech signal; (3) making trend analysis for the recursive graph; (4) making area block processing directly for the recursive graph and making matrix processing for the signal recursive graph; (5) making matrix processing for the recursive graph of the signal; (5) making matrix processing for the recursive graph of the speech signal. Recursive graph is processed by image processing, and the image matrix after format conversion is processed by binarization and filtering of two specific structure templates in turn. (6) Classifier is used to classify and recognize signals, and automatic recognition results are obtained. Compared with the existing technology, the test results are objective and accurate, which can achieve a higher degree of automatic measurement. It can provide reliable reference data for the clinical digital evaluation of voice rhinorrhea in cleft palate. It meets the development needs of accurate medical treatment and carries out more accurate and effective signal classification and recognition.

【技术实现步骤摘要】
基于递归图分析的腭裂语音鼻漏气的识别方法
本专利技术涉及语音信号处理领域,尤其是一种基于递归图分析的腭裂语音鼻漏气的识别方法。
技术介绍
先天性腭裂畸形最明显的功能障碍之一是语音障碍,由于腭裂丧失了口鼻腔之间正常的骨性和肌性分离,导致患者在发音过程中无法控制气流的大小和方向。腭裂患者由于腭咽闭合不全使发音时腭咽瓣不能完全关闭,气流同时经过了鼻腔和口腔,产生异常共振、鼻漏气、高鼻音等典型的腭裂语音。发音者在发辅音时,有气流从鼻腔漏出,这种气流通过鼻腔的声音有时在发音过程中可以被听见就称为鼻漏气。鼻漏气主要出现于塞音、塞擦音及擦音等压力性辅音,其音质发生变化。近年来,国内外学者致力于研究更为客观的数字化语音处理与识别方法,但现有技术中较少有用于鼻漏气语音的诊断与评估的研究,并且缺乏对鼻漏气语音的有效自动识别检测。
技术实现思路
本专利技术针对现有技术存在的上述技术问题,提供一种基于递归图分析的腭裂语音鼻漏气的识别方法,利用递归图趋势分析得出的改进参数,再针对递归图做区域分块处理得到最小区域矩阵计算相应参数,以及针对递归图做图像分析处理得到图像矩阵,将这些参数作为语音信号的特征参数,采用分类器本文档来自技高网...

【技术保护点】
1.一种基于递归图分析的腭裂语音鼻漏气的识别方法,其特征在于,包括以下步骤:(1)语音信号预处理,对输入的语音信号进行降采样、归一化分帧、预加重及幅值归一化;(2)对预处理后的语音信号求取语音信号的递归图矩阵,将系统中的时间序列提取出来,重现递归信号,选择合适的嵌入维数m和延迟时间τ将一维的非线性时间序列:{s(i),i=1,2,...}  (2)重构出向量:Si=[s(i),s(i+τ),...,s(i+(m‑1)τ)]  (3),系统的m维相空间轨道由有时间标记的向量序列构成:{Si,i=1,2,...,N}  (4)然后用这些相空间上的点作为行和列构成N×N的矩阵递归图;图中的每个节点R...

【技术特征摘要】
1.一种基于递归图分析的腭裂语音鼻漏气的识别方法,其特征在于,包括以下步骤:(1)语音信号预处理,对输入的语音信号进行降采样、归一化分帧、预加重及幅值归一化;(2)对预处理后的语音信号求取语音信号的递归图矩阵,将系统中的时间序列提取出来,重现递归信号,选择合适的嵌入维数m和延迟时间τ将一维的非线性时间序列:{s(i),i=1,2,...}(2)重构出向量:Si=[s(i),s(i+τ),...,s(i+(m-1)τ)](3),系统的m维相空间轨道由有时间标记的向量序列构成:{Si,i=1,2,...,N}(4)然后用这些相空间上的点作为行和列构成N×N的矩阵递归图;图中的每个节点Ri,j由对应的行、列向量点之间的距离来表示:Ri,j=θ(ε-||Si-Sj||),i,j=1,2,...,N(5),其中ε是根据先前情况设定的阈值常数,用来表示临界距离;符号||*||表示取向量的欧几里德(Euclidean)范数;θ(x)是核函数;若Ri,j的值为1,则对应递归图中位置点(i,j)就表示为一个黑点,若Ri,j的值为0,则对应递归图中位置点(i,j)就表示为一个白点,得到二维递归矩阵RP;(3)针对递归图做趋势分析,采用定量递归分析的5种针对递归图分析的量化参数,包括确定性DET、递归度RRL、最长对角线LL、熵ENTR和趋势分析RT,将对角线在递归图中分布的概率密度,对应在频域上转化为对角线特征LLF函数,并将频域上每一个对角线下区域对应的熵值转化为频域熵值PENTR;(4)针对递归图直接做区域分块处理,对信号递归图做矩阵处理,求取行列值,选取合适的分块系数,根据统计特性来确定分块系数,将递归图分为相应区域后,提取出递归图四个角的最小区域部分矩阵如下:其中RP为递归矩阵,m为所求的分块系数,分块系数m的计算即将整个递归图分为m*m个部分,根据矩阵所有点数总和,按每个区域1000个点划分,计算公式为:提取出递归图四个角(左上、左下、右上、右下)的递归矩阵RPa,每个分块后小矩阵的标号用a表示;此时四个角为最小区域部分的矩阵作为特征参数,再针对每一个最小区域部分做处理,计算区域均方值,模拟当一维信号转换到二维图像上分布密集区域的权值,计算公式如下:此处矩阵点Ri,j∈RPa,Na表示该最小区域矩阵的点数总和;(5)对递归图进行图像处理,将格式转换后的图像矩阵,依次进行二值化处理和两次特定结构模板的滤波处理后得到处理后的矩阵信号特征用于分类识别;(6)利用分类器对信号进行分类识别,得到自动识别结果。2.如权利要求1所述的基于递归图分析的腭裂语音鼻漏气的识别方法,其特征在于,所述步骤3具体包括以下步骤:(1.1)语音信号降采样,按照采样频率44100降采样到15000或8000的比例对数据进行处理;(1.2)归一化:对每一个语音数据求取绝对值最大的幅值max,然后将语音信号中的每一个值分别除以该最大值,进行归一化,相应的计算公式为:s=xx/max|xx|(1)其中xx为输入的语音信号,s为处理后的序列。3.如权利要求1所述的基于递归图分析的腭裂语音鼻漏气的识别方法,其特征在于,所述步骤3中的量化参...

【专利技术属性】
技术研发人员:何凌刘新怡尹恒何飞付佳
申请(专利权)人:四川大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1