基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法技术

技术编号:42735511 阅读:27 留言:0更新日期:2024-09-18 13:31
本发明专利技术属于语音信号特征提取领域,具体涉及一种基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法。该方法包括三大部分:一、对语音信号进行粗粒化处理得到粗粒化序列,并计算粗粒化序列的分布概率,然后计算粗粒化序列的熵,再根据粗粒化序列的熵计算变化率,根据变化率得到线性映射函数,最后基于线性映射函数构建梅尔滤波器;二、对语音信号进行预处理,其次基于语音信号得到频谱,再根据频谱得到功率频谱;三、将功率频谱输入到梅尔滤波器中,计算对数幅度谱,最后基于对数幅度谱得到优化后的梅尔倒谱系数。本发明专利技术结合时域分析和多尺度熵,将多尺度熵信息及频率信息结合更加紧密,提高了特征的多尺度敏感性,使得时频域特征得以兼顾。

【技术实现步骤摘要】

本专利技术涉及一种信号特征提取方法,具体涉及一种基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法


技术介绍

1、语音交互已成为人机交互之间的一条重要途径,因此,自动语音识别显得尤为重要。

2、语音信号特征提取是自动语音识别中的关键,而梅尔倒谱系数(mel-frequencycepstral coefficients,简称“mfcc”)可以直观地展示出语音信号在频域上的分布情况,因此,梅尔倒谱系数被广泛应用于语音信号特征提取。

3、然而,传统梅尔倒谱系数在语音信号特征提取过程中,存在因带宽固定、缺乏动态特征以及时频域特征难以顾全,而导致特征提取不够突出全面的问题。


技术实现思路

1、本专利技术的目的是解决现有梅尔倒谱系数在语音信号特征提取过程中,存在带宽固定、缺乏动态特征以及时频域特征难以顾全,导致特征提取不够突出全面的技术问题,而提供一种基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法。

2、为实现上述目的,本专利技术所采用的技术方案为:

3、一种基于梅尔倒谱本文档来自技高网...

【技术保护点】

1.一种基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于:

3.根据权利要求2所述的基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于:

4.根据权利要求3所述的基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于:

5.根据权利要求4所述的基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于:

6.根据权利要求1-5任一所述的基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于:<...

【技术特征摘要】

1.一种基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于:

3.根据权利要求2所述的基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于:

4.根据权利要求3所述的基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于:

5.根据权利要求4所述的基于梅尔倒谱系数与多尺度熵的语音信号特征提取方法,其特征在于:

...

【专利技术属性】
技术研发人员:张海峰李彪乔铁柱崔思栋岳智超
申请(专利权)人:中国科学院西安光学精密机械研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1