一种基于多种声音特征的相似度计算方法技术

技术编号：17100493 阅读：177 留言：0更新日期：2018-01-21 11:52

本发明专利技术涉及一种基于多种声音特征的相似度计算方法，属于音频信号处理技术领域。首先对声音信号进行预处理，预处理过程包括：预加重、分帧处理、加窗函数，然后提取声音信号的时域特征、频域特征、倒谱域特征。时域特征包括：短时平均过零率和短时自相关函数；频域特征包括：短时功率谱密度函数；倒谱域特征包括：梅尔频率倒谱系数和线性预测倒谱系数。分别针对提取的音频特征进行相似度值的计算，通过对待测音频特征分别做互相关的方法，得到每一种特征参数计算的相似度值。

A similarity calculation method based on multiple sound characteristics

The invention relates to a similarity calculation method based on multiple sound characteristics, which belongs to the field of audio signal processing technology. First, we preprocess the voice signal, including preemphasis, framing and windowing functions, and extract the temporal characteristics, frequency domain characteristics and cepstrum domain characteristics of the voice signal. The time domain features include short-time average zero crossing rate and short-time autocorrelation function. The frequency domain features include short time power spectral density function, cepstral domain characteristics, including Mel frequency cepstrum coefficient and linear prediction cepstrum coefficient. The similarity values of the extracted audio features are calculated respectively, and the similarity values of each feature parameter are calculated by cross-correlation method.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多种声音特征的相似度计算方法
本专利技术涉及一种基于多种声音特征的相似度计算方法，属于音频信号处理

技术介绍
在语音识别、语音内容相似性判别系统中，特征提取过程就是抽取保持语音最重要特征，并消除与语音无关信号的干扰。特征参数的选择直接影响着相似性判别的准确率。本专利技术分别提取时域特征参数、频域特征参数、倒谱域特征参数，因不同特征参数表征的音频信息不同，对相似性判别的贡献不同，对此，为了能够有效准确的比较待测音频的相似性，使以特征参数判别相似性的方法具有更好的鲁棒性，提出了对不同特征参数计算的相似度值线性加权的方法。
技术实现思路
本专利技术要解决的技术问题是提供一种基于多种声音特征的相似度计算方法，分别通过时域特征参数、频域特征参数、倒谱域特征参数进行音频信号相似度的计算，并对不同特征参数计算的结果进行线性加权。本专利技术的技术方案是：一种基于多种声音特征的相似度计算方法，包括以下步骤：(1)预处理：预处理过程分为三个步骤：预加重处理、分帧处理、加窗函数；(2)提取特征参数：分别提取表征音频信号信息的时域特征，频域特征，倒谱域特征；(3)相似度值计算：分别计算每种特征参数的相似度值；(4)相似度值线性加权：把每一种特征参数计算的相似度值进行线性加权，通过试验方法，确定权重系数，从而确定待测音频的相似度。上述的一种基于多种声音特征的相似度计算方法，步骤(1)中预处理，其中把待测音频信号进行分帧处理：音频序列是时间轴上的一维信号，为了能够对其进行信号分析，需要假设音频信号在毫秒级别的短时间处于稳定状态，因此在此基础上对音频信号进行分帧操作。对音...
一种基于多种声音特征的相似度计算方法

【技术保护点】
一种基于多种声音特征的相似度计算方法，其特征在于具体步骤为：(1)预处理：预处理过程分为三个步骤：预加重处理、分帧处理、加窗函数；(2)提取特征参数：分别提取表征音频信号信息的时域特征参数、频域特征参数、倒谱域特征参数；(3)相似度值计算：分别计算每种特征参数的相似度值；(4)相似度值线性加权：把每一种特征参数计算的相似度值进行线性加权，通过试验方法，确定权重系数，从而计算待测音频的相似度。

【技术特征摘要】
1.一种基于多种声音特征的相似度计算方法，其特征在于具体步骤为：(1)预处理：预处理过程分为三个步骤：预加重处理、分帧处理、加窗函数；(2)提取特征参数：分别提取表征音频信号信息的时域特征参数、频域特征参数、倒谱域特征参数；(3)相似度值计算：分别计算每种特征参数的相似度值；(4)相似度值线性加权：把每一种特征参数计算的相似度值进行线性加权，通过试验方法，确定权重系数，从而计算待测音频的相似度。2.根据权利要求1所述的基于多种声音特征的相似度计算方法，其特征在于：所述预处理中的预加重处理、分帧处理、加窗函数具体为：(1)预加重处理：声门脉冲的频率响应曲线接近于一个二阶低通滤波器，而口腔的辐射响应也接近于一个一阶高通滤波器，预加重的目的是为了补偿高频分量的损失，提升高频分量；(2)分帧处理：由于语音信号是一个准稳态的信号，把它分成较短的帧，在每帧中可将其看成稳态信号，可用处理稳态信号的方法处理，同时，为了使一帧与另一帧之间的参数能较平稳地过渡，在两帧之间互相有部分重叠；(3)加窗函数：加窗函数的目的是减少频域中的泄漏，将对每一帧语音乘以汉明窗或海宁窗。3.根据权利要求1所述的基于多种声音特征的相似度计算方法，其特征在于：所述时域特征参数、频域特征参数、倒谱域特征参数具体为：(1)提取时域特征参数：时域特征参数包括短时平均过零率和短时自相关函数；(2)提取频域特征参数：频域特征参数是短时功率谱密度函数；(3)提取倒谱域特征参数：倒谱域特征参数包括梅尔频率倒谱系数和线性预测倒谱系数；把音频信号进行预处理后，分别提取音频信号...

【专利技术属性】
技术研发人员：龙华，张琳，邵玉斌，杜庆治，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：云南,53

全部详细技术资料下载我是这个专利的主人