【技术实现步骤摘要】
本专利技术属于多媒体数据检索、处理技术,特别涉及音频数据分析、索引、搜索和检索技术。
技术介绍
媒体音频数据,已经成为网络、信息时代信息的重要组成部分。如何对各种音频数据进行分类、搜索、索引和检索已经成为音频数据广泛应用的瓶颈。因此,音频数据的分类、识别、自动检索、智能浏览、基于内容的检索和基于音频信号对视频数据进行检索等引起广泛的研究。这类研究一般通过对声音的分析来产生各种特征,通过特征来实现搜索和检索声音(Wold et al.1996)。其中,经常使用的特征包括音频信号的短时离散傅立叶变换、短时自相关序列、倒谱系数、Mel频率倒谱系数、谱质心(Spectral)、谱衰减(Spectral Roll-off)、谱通量(Spectral Flux)、基频(Fundamental Frequency)、过零率(Zero-Crossing Rate)和能量(Rate)等。这些特征可以作为视听数据内容分析的主要部分(Wand et al.2000)。同样,Zhang etal.(2001)通过对这些特征的分析来确定语音、音乐、歌声、环境声音、带音乐背景的语音、带音乐背景的环境声、静音等,从而实现视听数据的自动分段和分类。Cristani et al.(2007)则利用这些特征,实现视听数据自动场景分析和理解。对于音乐数据的检索,Pikrakis et al.(2003,2006)通过分析特征序列的相邻频率突变的相关性,实现音 ...
【技术保护点】
一种基于MFCCM的音频数据检索方法,其特征在于:该方法通过以下步骤实现: 步骤一:根据现有的音频数据构建音频数据MFCCM数据库,并计算待查询、检索的音频数据mfcc_q矩阵; 步骤二:对MFCCM进行多列塔型检索,选出一定比例的相关音频数据; 步骤三:MFCCM与mfcc_q矩阵列的相似性分析,得到可能的音频数据与待查询数据相似的帧的起始点; 步骤四:计算MFCCM与mfcc_q相关帧的距离msc,取其中msc最小的音频数据为检索结果。 以上四步骤,可以根据对检索精度的要求只采用步骤一、步骤二,也可以采用步骤一、步骤二、步骤三和步骤四来实现音频数据检索。
【技术特征摘要】
1.一种基于MFCCM的音频数据检索方法,其特征在于:该方法通过以下步骤实现:
步骤一:根据现有的音频数据构建音频数据MFCCM数据库,并计算待查询、检索的音频
数据mfcc_q矩阵;
步骤二:对MFCCM进行多列塔型检索,选出一定比例的相关音频数据;
步骤三:MFCCM与mfcc_q矩阵列的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。