当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于能量算子的病理嗓音频谱重构方法技术

技术编号:34354812 阅读:14 留言:0更新日期:2022-07-31 06:23
本发明专利技术提供了一种基于能量算子的病理嗓音频谱重构方法,包括病理嗓音信号基频自适应加窗、计算功率谱、重构功率谱、功率谱的频域平滑处理、计算功率倒频谱、同态滤波以及计算频谱包络。本发明专利技术公开的一种基于能量算子的病理嗓音频谱重构方法,改善了病理嗓音频谱分量过于分散的问题,能够有效提取嗓音的主要信息、频谱分量和峰值,获得重构的病理嗓音频谱包络,解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。提取总是失效的问题。提取总是失效的问题。

A spectrum reconstruction method of pathological voice based on energy operator

【技术实现步骤摘要】
一种基于能量算子的病理嗓音频谱重构方法


[0001]本专利技术属于信息
,尤其是涉及一种基于能量算子的病理嗓音频谱重构方法。

技术介绍

[0002]病理嗓音是指由于声带组织发生病变,声带张力变小,同时声道结构功能性改变导致声带不规则振动、声门出现高次谐波、信号周期性发生改变、幅度及其频率出现波动的嗓音。病理嗓音修复是嗓音障碍研究领域的一个新方向,旨在通过修复病理嗓音信号提高语音可懂度,通过非侵入式的语音信号处理技术修复病理嗓音,可以提高病理嗓音信号的清晰度和可懂度,帮助嗓音疾病患者体验更为便利的语音交互。
[0003]发声系统的数学模型分为激励、声道和辐射共三个子模型。嗓音疾病影响的发声器官对应的是激励模型和声道模型。对于激励模型,基频表征嗓音的音调高低,是激励模型中描述声带振动频率重要的特征参数。对于声道模型,共振峰的位置、宽度、幅度等是声道参数中影响元音音色的重要参数。对于整个发声系统而言,频谱包络可以勾勒整段语音的主要信息,同时包含频谱分量、峰值幅度等主要参数。
[0004]传统的激励模型提取算法虽然具有计算复杂度低的优点,但是在提取过程中会出现峰值突变,导致二次倍频和分频错误,提取声道参数时,对纯净嗓音信号检测有效,但是在计算复杂的滤除声道卷积信号时容易发生误差,存在传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。

技术实现思路

[0005]有鉴于此,本专利技术旨在提出一种基于能量算子的病理嗓音频谱重构方法,改善了病理嗓音频谱分量过于分散的问题,能够有效提取嗓音的主要信息、频谱分量和峰值,获得重构的病理嗓音频谱包络,解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。
[0006]为达到上述目的,本专利技术的技术方案是这样实现的:一种基于能量算子的病理嗓音频谱重构方法,包括:步骤一: 病理嗓音信号基频自适应加窗:采用长度为mT0的汉宁窗w(n),对病理嗓音信号x(n)进行分段加窗,其中T0为病理嗓音信号x(n)的基音周期,m为大于零的整数,n为时域变量;步骤二: 计算功率谱:计算步骤一中使用汉宁窗w(n)加窗的病理嗓音信号x(n)的功率谱,其中为角频率;步骤三: 重构功率谱:进一步对功率谱进行非线性变换得到Teager能量算子,再对能量算子幅值归一化得到重构功率谱;步骤四:功率谱的频域平滑处理:进一步通过一个的矩形窗,对重构功率谱
进行频域平滑处理,得到平滑后的功率谱;步骤五:计算功率倒频谱:计算功率谱的功率倒频谱;步骤六:同态滤波:使用同态滤波函数对功率倒频谱进行平滑滤波和频谱恢复,得到同态滤波后的倒频谱;步骤七:计算频谱包络:对倒频谱使用傅里叶逆变换得到重构的病理嗓音频谱包络。
[0007]相对于现有技术,本专利技术所述的一种基于能量算子的病理嗓音频谱重构方法,具有以下优势:本专利技术公开了一种基于能量算子的病理嗓音频谱重构方法,改善了病理嗓音频谱分量过于分散的问题,能够有效提取嗓音的主要信息、频谱分量和峰值,获得重构的病理嗓音频谱包络,解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题,具有提取效果好,适用性强的特点。
附图说明
[0008]构成本专利技术的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0009]在附图中:图1为本专利技术实施例所述的一种基于能量算子的病理嗓音频谱重构方法流程示意图;图2为本专利技术实施例所述的一种基于能量算子的病理嗓音频谱重构方法重构前示意图;图3为本专利技术实施例所述的一种基于能量算子的病理嗓音频谱重构方法重构后示意图。
具体实施方式
[0010]需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0011]在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0012]在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可
以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本专利技术中的具体含义。
[0013]下面将参考附图并结合实施例来详细说明本专利技术。
[0014]如图1所示,一种基于能量算子的病理嗓音频谱重构方法,包括:步骤一: 病理嗓音信号基频自适应加窗:采用长度为mT0的汉宁窗w(n),对病理嗓音信号x(n)进行分段加窗,其中T0为病理嗓音信号x(n)的基音周期,m为大于零的整数,n为时域变量;在本实施例中,病理嗓音信号x(n)选自MEEI语音库中元音/a/,每个元音采样率为8kHz,m=3,帧移为128。
[0015]步骤二: 计算功率谱:计算步骤一中使用汉宁窗w(n)加窗的病理嗓音信号x(n)的功率谱,其中为角频率;步骤三: 重构功率谱:进一步对功率谱进行非线性变换得到Teager能量算子,再对能量算子幅值归一化得到重构功率谱;步骤四:功率谱的频域平滑处理:进一步通过一个的矩形窗,对重构功率谱进行频域平滑处理,得到平滑后的功率谱;步骤五:计算功率倒频谱:计算功率谱的功率倒频谱;步骤六:同态滤波:使用同态滤波函数对功率倒频谱进行平滑滤波和频谱恢复,得到同态滤波后的倒频谱;步骤七:计算频谱包络:对倒频谱使用傅里叶逆变换得到重构的病理嗓音频谱包络。
[0016]进一步的,在步骤二中:的计算过程如下:通过上述关系式,利用快速傅里叶变换可以得到功率谱,其中T0为病理嗓音信号x(n)的基音周期,m为大于零的整数,n为时域变量。
[0017]进一步的,步骤三中:对功率谱进行非线性变换得到Teager能量算子如下: 幅值归一化得到重构功率谱如下:
其中,是Teager能量算子的最大值,是Teager能量算子的最小值,为角频率。
[0018]进一步的,步骤四中,矩形窗宽度为,功率谱如下计算得到:其中,为中间变量,为角频率,m为大于零的整数。
[0019]进一步的,在步骤五中,因为周期为T0的时域信号的频谱是周期为的频域信号,功率倒频谱如下计算得到:其中,是傅里叶逆变换,是倒频率。
[0020]进一步的,在步骤六中:如下计算得到:如下计算得到:如下计算得到:其中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于能量算子的病理嗓音频谱重构方法,其特征在于:包括:步骤一: 病理嗓音信号基频自适应加窗:采用长度为mT0的汉宁窗w(n),对病理嗓音信号x(n)进行分段加窗,其中T0为病理嗓音信号x(n)的基音周期,m为大于零的整数,n为时域变量;步骤二: 计算功率谱:计算步骤一中使用汉宁窗w(n)加窗的病理嗓音信号x(n)的功率谱,其中为角频率;步骤三: 重构功率谱:进一步对功率谱进行非线性变换得到Teager能量算子,再对能量算子幅值归一化得到重构功率谱;步骤四:功率谱的频域平滑处理:进一步通过一个的矩形窗,对重构功率谱进行频域平滑处理,得到平滑后的功率谱;步骤五:计算功率倒频谱:计算功率谱的功率倒频谱;步骤六:同态滤波:使用同态滤波函数对功率倒频谱进行平滑滤波和频谱恢复,得到同态滤波后的倒频谱;步骤七:计算频谱包络:对倒频谱使用傅里叶逆变换得到重构的病理嗓音频谱包络。2.根据权利要求1所述的一种基于能量算子的病理嗓音频谱重构方法,其特征在于:在步骤二中:的计算过程如下:通过上述关系式,利用快速傅里叶变换可以得到功率谱,其中T0为病理嗓音信号x(n)的基音周期,m为...

【专利技术属性】
技术研发人员:张涛刘赣俊赵鑫
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1