【技术实现步骤摘要】
本专利技术涉及一种音频处理和模式识别
,尤其涉及一种基于隐马尔可夫模型的相似度比较方法。
技术介绍
基于内容的音频语义特征相似度比较方法的研究,是基于内容的音乐检索以及音乐推荐领域的一个重要分支,具体是指通过音频特征分析,对不同音频数据赋以不同的语义,使具有相同语义的音频在听觉上保持相似。由于音乐与人的听觉感知紧密相关,它更多的传达了一种感情,一种很难量化的情绪,音乐的这种特性决定了在音频的分类检索技术中所用到的歌名、演唱者等外在信息对音乐分析并不适用。因此找到能够表征音乐的某些特征以及如何对音乐的高层语义信息进行描述都是非常急需的。 如何提取音乐中的较低层特征(音调、旋律以及节奏等),使得无序的音频顺序变得有序,是基于内容的音频检索技术实现应用的关键。目前的研究都是基于某一种音频特征,比如提取了基于美尔频率的倒谱系数MFCC,或是先将人类听觉感知中的等响度预加重、强度、响度等特性进行一系列的工程模拟,之后采用全极点模型进行线性预测分析从而得到相应的LPC系数,还有的研究使用MFCC或LPC的动态特征来刻画音频信号的时变特性,即原始特征的一阶和二阶差分。对于音乐内容而言,仅有低层声学特征是不够的,如何描述音乐的高层语义概念也是一个关键问题。随着生活条件的提高,人们越来越注重精神品味的培养,在不同的场合人们将需求不同的音乐,对音乐的用途提出了越来越明确以及细致的要求,这些要求是传统的研究无法实现的。
技术实现思路
专利技术目的本专利技术的目的在于提供,其能够提取音乐信号的特征参数,并利用所提取出的特征参数建立基于语义关键词的HMM,继而能够根据概率模型比 ...
【技术保护点】
一种基于内容的音频语义特征相似度比较方法,其特征在于:包括如下步骤:1)提取帧长5s,帧移0.5s的音乐,而后提取音乐中的特征参数;2)将上述特征参数组成特征矢量;3)构建174个关键词描述的词汇库,然后以每个关键词作为模型,以特征矢量为训练样本构造隐马尔可夫模型;4)对隐马尔可夫模型输出概率多项式,得到基于关键词的概率分布;5)根据KL公式比较基于给定关键词的相似度比较。
【技术特征摘要】
1.一种基于内容的音频语义特征相似度比较方法,其特征在于包括如下步骤 1)提取帧长5S,帧移O.5s的音乐,而后提取音乐中的特征参数; 2)将上述特征参数组成特征矢量; 3)构建174个关键词描述的词汇库,然后以每个关键词作为模型,以特征矢量为训练样本构造隐马尔可夫模型; 4)对隐马尔可夫模型输出概率多项式,得到基于关键词的概率分布; 5)根据KL公式比较基于给定关键词的相似度比较。2.根据权利要求I所述的一种基于内容的音频语义特征相似度比较方法,其特征在于所述的隐马尔可夫模型构造方法包括如下步骤 1)根据公式bX0t)=]~[ T,cJsmN(OslTjjsn, ) *求出状态输出观测值的概率b ; 5=1 L w-i_ 其中N是高斯概率密度函数,O是音乐的特征系数即观测序列,μ、Σ、C分别是均值、方差以及权重系数,M是每个状态包含的高斯混元个数; 2)设置迭代次数,用Viterbi算法计算HMM输出所有训练音频观测序列的概率Ρ(0/入),并累加得到Σ 中,再用Baum-Welch算法对模型参数进行重估,得到λ I,再用Viterbi算法计算HMM输出所有训练音频观测序列的概率Ρ(0/λ 1),并累加得到Σ 2中; 3)将Σ1和Σ 2结果进行比较,判断结果是否小于预设阈值,是的话,则无需进行重估计算,将λ I作为计算结果输出,都则将λ I作新一轮运算。3.根据权利要求2所述的一种基于内容的音频语义特征相似度比较方法,其特...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。