音频文件检索方法、系统和音频文件类型识别方法、系统技术方案

技术编号:7239763 阅读:235 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了音频文件检索方法、系统和音频文件类型识别方法、系统。该音频文件检索方法包括:预先确定音频文件库中各个音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数;提取待检索音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数,将待检索音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数与音频文件库中各个音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数进行匹配,根据匹配结果从音频文件库中检索出音频文件。应用本发明专利技术能够根据曲调检索音频文件、或者能够检索出属于某种类型的音频文件、或者提高识别音频文件属于哪一类型的效率。

【技术实现步骤摘要】

本专利技术涉及音频文件检索
,尤其涉及音频文件检索方法、系统和音频文件类型识别方法、系统
技术介绍
音频文件检索的核心任务是基于音频文件库检索出满足用户需求的音频文件。目前,音频文件检索系统只能根据用户提供的音频文件名称、歌手名字等音频文件的属性特征检索音频文件,这种方法存在如下的缺点首先,当用户不知道音频文件的名称、歌手名字等属性特征,而仅仅能哼出曲调时,现有的音频检索系统无法根据曲调检索出相应的音频文件。再者,当用户并不是想找某个确定的音频文件,而是想找能够表达某种意境的音频文件时,现有的音频检索系统也无法检索出相应的音频文件。另外,如果对所有音频文件采用人工方法进行意境类型识别,将耗费大量的人力, 且效率较低。
技术实现思路
有鉴于此,本专利技术提供了音频文件检索方法、系统和音频文件类型识别方法、系统,以便能够根据曲调检索音频文件、或者能够检索出属于某种类型的音频文件、或者提高识别音频文件属于哪一类型的效率。一种音频文件检索方法,该方法包括预先确定音频文件库中各个音频文件的倒谱频率MFCC系数和/或音律特征Pitch 系数;提取待检索音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数,将待检索音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数与音频文件库中各个音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数进行匹配,根据匹配结果从音频文件库中检索出音频文件。一种音频文件检索系统,该系统包括音频文件库、音频特征提取模块、匹配模块和检索模块;所述音频文件库,存储有各个音频文件的倒谱频率MFCC系数和/或音律特征 Pitch系数;所述音频特征提取模块,提取待检索音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数;所述匹配模块,将待检索音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数与音频文件库中各个音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数进行匹配;所述检索模块,根据所述匹配模块的匹配结果从音频文件库中检索出音频文件。6一种音频文件类型识别方法,该方法包括在特征库中存储各种音频类型对应的特征音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数;提取待识别音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数,将待识别音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数与每个特征音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数进行匹配,根据匹配度以及特征音频文件所属的音频类型识别出所述待识别音频文件的音频类型。一种音频文件类型识别系统,该系统包括特征库、音频特征提取模块、匹配模块和类型识别模块;所述特征库,存储各种音频类型对应的特征音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数;所述音频特征提取模块,提取待识别音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数;所述匹配模块,将待识别音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数与每个特征音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数进行匹配;所述类型识别模块,根据所述匹配模块得到的匹配度以及特征音频文件所属的音频类型识别出所述待识别音频文件的音频类型。一种音频文件检索方法,该方法包括在特征库中存储各种音频类型对应的特征音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数;预先提取音频文件库中的音频文件的倒谱频率MFCC系数和/或音律特征Pitch 系数,将音频文件库中的音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数与每个特征音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数进行匹配,根据匹配度以及特征音频文件所属的音频类型识别并存储音频文件库中音频文件的音频类型;接收待检索的音频类型,根据存储的音频文件库中音频文件的音频类型,检索出属于所述待检索的音频类型的音频文件。一种音频文件检索系统,该系统包括特征库、音频文件类型识别模块、音频文件类型存储模块和检索模块;所述特征库,存储各种音频类型对应的特征音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数;所述音频文件类型识别模块,预先提取音频文件库中的音频文件的倒谱频率MFCC 系数和/或音律特征Pitch系数,将音频文件库中的音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数与每个特征音频文件的倒谱频率MFCC系数和/或音律特征Pitch系数进行匹配,根据匹配度以及特征音频文件所属的音频类型识别音频文件库中音频文件的音频类型;所述音频文件类型存储模块,根据所述音频文件类型识别模块的识别结果存储音频文件库中音频文件的音频类型;所述检索模块,接收待检索的音频类型,根据所述音频文件类型存储模块中存储的各音频文件的音频类型,检索出属于所述待检索的音频类型的音频文件。由上述技术方案可见,本专利技术通过提取音频文件的音频特征数据,即MFCC系数和 Pitch系数,比较待检索音频文件的音频特征数据和音频库中音频文件的音频特征数据,使得音频检索系统能够根据曲调检索音频文件。当本专利技术通过匹配音频库中每个音频文件的音频特征数据与特征库中各个类型的特征音频文件的音频特征数据,根据匹配结果识别某一音频文件属于哪一类型的音频文件时,由于不需要人工对每个音频文件进行识别,因此能够提高识别音频文件属于哪一类型的效率。还可以采用本专利技术提供的音频类型识别方法识别出音频文件库中各个音频文件的音频类型并存储每个音频文件的音频类型,从而能够根据待检索的音频类型检索出相应的音频文件。附图说明图1是本专利技术提供的音频文件检索方法流程图。图2是MFCC系数的提取方法流程。图3是Pitch系数的提取方法流程。图4是本专利技术提供的音频文件检索系统组成示意图。图5是本专利技术提供的音频文件类型识别方法流程图。图6是本专利技术提供的音频文件类型识别系统组成示意图。图7是本专利技术提供的音频文件检索方法流程图。图8是本专利技术提供的音频文件检索系统组成示意图。具体实施例方式图1是本专利技术提供的音频文件检索方法流程图。如图1所示,该方法包括步骤101,预先确定音频文件库中各个音频文件的倒谱频率MFCC系数和音律特征 Pitch系数。步骤102,提取待检索音频文件的倒谱频率MFCC系数和音律特征Pitch系数。步骤103,将待检索音频文件的倒谱频率MFCC系数和音律特征Pitch系数与音频文件库中各个音频文件的倒谱频率MFCC系数和音律特征Pitch系数进行匹配。步骤104,根据匹配结果从音频文件库中检索出音频文件。其中,Mel倒谱频率系数(MFCC)是基于人耳的听觉特性提出的,它采用一种非线性的频率单位(Mel频率)来模拟人的听觉系统。声学研究表明,MFCC系数能较好地反应音频特征。图1所示方法进行音频文件检索所依据的音频特征数据包括音频文件的MFCC系数和Pitch系数,在实际应用中,也可以仅依据MFCC系数或仅依据Pitch系数。图2是MFCC系数的提取方法流程。如图2所示,该方法包括步骤201,对输入的待检索音频文件信号进行预加重处理。预加重的目的是使信号的频谱变得平坦,保持从低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析。具体可以采用现有技术进行预加重。步骤202,对预加本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:肖力豪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术