当前位置: 首页 > 专利查询>福州大学专利>正文

一种基于MFCCM的音频数据检索方法技术

技术编号:2827538 阅读:284 留言:0更新日期:2012-04-11 18:40
本发明专利技术属于多媒体数据检索、处理技术,提提供一种基于MFCCM的音频数据检索方法,通过构建音MFCCM,对MFCCM进行多列塔型检索,MFCCM与mfcc_q矩阵列的相似性分析,计算MFCCM与mfcc_q相关帧的距离等步骤实现。本发明专利技术所采用的方法克服现有方法中存在的检索效率和检索精度的问题,为多媒体数据检索、处理,音频数据分析、索引、搜索和检索提供一种高效率和高精度的方法。

【技术实现步骤摘要】

本专利技术属于多媒体数据检索、处理技术,特别涉及音频数据分析、索引、搜索和检索技术。
技术介绍
媒体音频数据,已经成为网络、信息时代信息的重要组成部分。如何对各种音频数据进行分类、搜索、索引和检索已经成为音频数据广泛应用的瓶颈。因此,音频数据的分类、识别、自动检索、智能浏览、基于内容的检索和基于音频信号对视频数据进行检索等引起广泛的研究。这类研究一般通过对声音的分析来产生各种特征,通过特征来实现搜索和检索声音(Wold et al.1996)。其中,经常使用的特征包括音频信号的短时离散傅立叶变换、短时自相关序列、倒谱系数、Mel频率倒谱系数、谱质心(Spectral)、谱衰减(Spectral Roll-off)、谱通量(Spectral Flux)、基频(Fundamental Frequency)、过零率(Zero-Crossing Rate)和能量(Rate)等。这些特征可以作为视听数据内容分析的主要部分(Wand et al.2000)。同样,Zhang etal.(2001)通过对这些特征的分析来确定语音、音乐、歌声、环境声音、带音乐背景的语音、带音乐背景的环境声、静音等,从而实现视听数据的自动分段和分类。Cristani et al.(2007)则利用这些特征,实现视听数据自动场景分析和理解。对于音乐数据的检索,Pikrakis et al.(2003,2006)通过分析特征序列的相邻频率突变的相关性,实现音乐的自动分析和用变时HMM分类音乐。Pinquier et al.(2006)根据熵和稳定分段的时延,实现多媒体文件的语音和音乐轨迹检索。Fragoulis et al.(2001)通过对各种特征的分析,判定音乐录音的失真和不正常部分。Clausen et al.(2004)通过音乐通用特征的分析,实现音乐检索、失真容忍度分析。对于各种综合音频数据的检索,目前,人们也进行了广泛的研究。根据音频的特征,确定语音和非语音声音,再通过神经网络来确定非语音音频的类型(Ahmad et al.2006)。基于音频数据的特征,对音频数据进行基于内容的音频两阶段分段,来研究音频数据的分类和检索(Zhang et al.2006)。根据人类的听觉特性,判断语音性别,对枪声、汽车声等音频内容进行分类(Harb et al.2007)。用音频数据的特征,研究各种音频数据分类和检索的通用框架、研究模糊层次分类和全局分段框架,把音频数据分成语音、音乐、模糊和静音(Kiranyazet al.2006)。用音频数据的多特征向量,研究基于内容的音频数据检索(Kim et al.2006)。用支持向量机的加权因子和Euclidean距离来研究音频数据的分类(Chung et al.2007)。基-->于最小描述长度的高斯模型实现音频流分段和分类(Wu et al.2006)。通过认知最小变异失真响应、平滑过零率、临界带对数能量系数,用加权高斯马尔可夫模型网络,实现无监督分类分段(Rongqing et al.2006)等。这些方法普遍存在算法复杂,检索效率和检索精度偏低的问题。
技术实现思路
本专利技术的目的在于克服现有方法中存在的检索效率和检索精度的问题,为多媒体数据检索、处理,音频数据分析、索引、搜索和检索提供一种高效率和高精度的方法。本专利技术的目的是通过如下措施来达到:1、构建MFCCM把一个音频数据文件的每个帧的MFCC,作为矩阵的行,按顺序组成的矩阵就是MFCCM,它可以表示为mfcc(i,j)=Σl=1Llogm(l)cos{(l-12)jπL本文档来自技高网
...

【技术保护点】
一种基于MFCCM的音频数据检索方法,其特征在于:该方法通过以下步骤实现:    步骤一:根据现有的音频数据构建音频数据MFCCM数据库,并计算待查询、检索的音频数据mfcc_q矩阵;    步骤二:对MFCCM进行多列塔型检索,选出一定比例的相关音频数据;    步骤三:MFCCM与mfcc_q矩阵列的相似性分析,得到可能的音频数据与待查询数据相似的帧的起始点;    步骤四:计算MFCCM与mfcc_q相关帧的距离msc,取其中msc最小的音频数据为检索结果。    以上四步骤,可以根据对检索精度的要求只采用步骤一、步骤二,也可以采用步骤一、步骤二、步骤三和步骤四来实现音频数据检索。

【技术特征摘要】
1.一种基于MFCCM的音频数据检索方法,其特征在于:该方法通过以下步骤实现:
步骤一:根据现有的音频数据构建音频数据MFCCM数据库,并计算待查询、检索的音频
数据mfcc_q矩阵;
步骤二:对MFCCM进行多列塔型检索,选出一定比例的相关音频数据;
步骤三:MFCCM与mfcc_q矩阵列的...

【专利技术属性】
技术研发人员:李应
申请(专利权)人:福州大学
类型:发明
国别省市:35[中国|福建]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1