The invention discloses a method and a device, an audio feature extraction of electronic equipment, the method comprises the following steps: step one, get the audio data to be processed; step two, according to the magnitude of the energy spectrum of the processing of audio data, to determine the candidate extreme original point processing audio data; step three, based on the influence coefficient the extreme point between the candidate and / or candidate based on extreme point density and / or between the candidate extremum difference based on the results of the original candidate extremum of each frame of audio data screening, get the audio number according to the extreme points list to be treated; step four, according to the extreme points of the audio processing the list data extraction of fingerprint features of audio data, the invention can improve the anti noise of audio feature extraction, audio feature extraction can make more accurate description of audio data .
【技术实现步骤摘要】
一种音频特征提取方法与装置、电子设备
本专利技术涉及语音信号处理、信息检索
,尤其涉及一种音频特征提取方法与装置、电子设备。
技术介绍
随着信息技术和大数据产业的爆发,海量的音视频以数字的形式存储起来,利用海量的音频数据进行分析处理是目前人工智能领域非常重要的一个方面,如对音频数据进行分析处理后进行音频检索、音乐原声检索;提取出音频数据中的有效语音后,进行语音识别等。在音频分析处理时,如何准确的提取音频数据的特征描述音频数据直接关系到音频数据的应用效果。现有的音频特征提取方法一般都是简单的根据音频数据的能量进行极值点检测,得到音频数据的极值点,然后提取相应极值点的音频特征,如频谱特征或基频特征等;或者,直接提取音频数据的频谱特征或基频特征对音频数据进行描述。然而,不论是确定音频数据的极值点后再提取音频数据的特征还是直接提取音频数据特征的方法,其抗噪性均较差,而当音频数据存在一些噪声时,就很难准确的提取音频特征对音频数据进行描述,严重影响后续音频数据的处理结果。
技术实现思路
为克服上述现有技术存在的不足,本专利技术之目的在于提供一种音频特征提取方法与装置、电子设 ...
【技术保护点】
一种音频特征提取方法,包括如下步骤:步骤一,获取待处理音频数据;步骤二,根据所述待处理音频数据的频谱能量幅度,确定原始候选极值点;步骤三,基于候选极值点之间的影响系数和/或基于候选极值点的密度和/或基于候选极值点之间的差分计算结果,对所述待处理音频数据的原始候选极值点进行筛选,得到所述待处理音频数据的极值点列表;步骤四,根据所述待处理音频数据的极值点列表提取音频数据的指纹特征。
【技术特征摘要】
1.一种音频特征提取方法,包括如下步骤:步骤一,获取待处理音频数据;步骤二,根据所述待处理音频数据的频谱能量幅度,确定原始候选极值点;步骤三,基于候选极值点之间的影响系数和/或基于候选极值点的密度和/或基于候选极值点之间的差分计算结果,对所述待处理音频数据的原始候选极值点进行筛选,得到所述待处理音频数据的极值点列表;步骤四,根据所述待处理音频数据的极值点列表提取音频数据的指纹特征。2.如权利要求1所述的一种音频特征提取方法,其特征在于,所述基于候选极值点之间的影响系数进行筛选的步骤进一步包括:依次选择当前帧音频数据的原始候选极值点作为候选中心极值点,构建以该候选中心极值点为中心的区域,获得该区域内的所有候选极值点;分别计算所述候选中心极值点与其他候选极值点之间的影响系数;根据影响系数以及候选极值点的频域幅度确定是否保留该候选中心极值点。3.如权利要求2所述的一种音频特征提取方法,其特征在于,所述根据影响系数确定是否保留该候选中心极值点的步骤具体为:若所述候选中心极值点的频域幅度大于或等于所述区域内每个非候选中心极值点的频域幅度与对应的影响系数的乘积,则保留所述候选中心极值点。4.如权利要求1所述的一种音频特征提取方法,其特征在于,所述基于候选极值点的密度进行筛选的步骤进一步包括:依次选择每帧音频数据的原始候选极值点和/或经基于候选极值点之间的影响系数筛选后的候选极值点中的每个极值点作为当前候选极值点,计算当前候选极值点的密度;若当前候选极值点的密度大于预先设定的阈值,则删除所述当前候选极值点,否则保留当前候选极值点。5.如权利要求4所述的一种音频特征提取方法,其特征在于,所述基于候选极值点之间的差分计算结果进行筛选的步骤进一步包括:对每帧音频数据的原始候选极值点和/或经基于候选极值点之间的影响系数筛选后的候选极值点和/或经基于候选极值点的密度筛选后的候选极值点中的每个候选极值点进行差分计算,得到每个候选极值点的差分频谱值;根据每个候选极值点的差分频谱值确定每帧音频数据的极值点列表。6.如权利要求5所述的一种音频特征提取方法,其特征在于,所述差分计算的步骤具体为:根据当前帧的前一或多帧音频数据的候选极值点及当前帧后一或多帧音频数据的候选极值点的频谱值对当前帧音频数据的候选极值点进行差分计算得到当前帧音频数据每个候选极值点差分后的差分频谱值。7.如权利要求1所述的一种音频特征提取方法,其特征在于,步骤四进一步包括:基于所述极值点列表中每个极值点构建候选区域,确定每个极值点的极值点对;根据所述极值点列表中的每个极值点对,提取每帧音频数据的指纹特征;将每帧音频数据的指纹特征进行合并,获得每段音频数据的音频指纹特征。8.如权利要求7所述的一种音频特征提取方法,其特征在于:所述基于所述极值点列表中每个极值点构建候选区域,确定每个极值点的极值点...
【专利技术属性】
技术研发人员:李永超,方昕,刘俊华,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。