【技术实现步骤摘要】
音频指纹检索方法及装置
本专利技术涉及音频处理技术,尤其涉及一种音频指纹检索方法及装置。
技术介绍
音频指纹(fingerprint)是根据音频信号计算出的一组独特标识(如,符号或数)。音频指纹检索可以是指:用户输入一个音频片段,将该音频片段的音频信号计算所得的音频指纹提交到网络服务器,网络服务器根据所述音频指纹从索引库内获取所述音频片段所在音频文件(如,歌曲)的原始信息,如歌曲的名称、歌曲的歌手名称等信息。该音频指纹检索技术可实现录音后搜索歌曲名、mp3的自动命名和歌词自动匹配、音视频排重等有价值的应用,尤其在无线互联网上将会有更大的产品价值。目前,现有的音频指纹检索主要包括以下的两种方法:第一种方法,将给定音频文件的音频信号以一定时间间隔进行均匀分帧,并得到所述音频信号对应的一组32bit的整数,即得到所述音频信号的音频指纹,并将所述音频信号的音频指纹、以及所述音频信号所对应的音频文件信息对应存储到一个哈希(hash)表中。需要检索音频片段所对应音频文件的相关信息时,首先对所述音频片段的音频信号进行均匀分帧,并得到该音频信号对应的一组32bit整数,即得到音频 ...
【技术保护点】
一种音频指纹检索方法,其特征在于,所述方法包括:对音频片段的音频信号进行分帧处理;通过起始点检测算法(ODF)确定所述分帧处理所得到的各分帧中的关键帧;得到所述关键帧的音频指纹,并根据所得到的音频指纹进行检索,得到对应所述音频片段的音频文件信息。
【技术特征摘要】
1.一种音频指纹检索方法,其特征在于,所述方法包括:对音频片段的音频信号进行分帧处理;通过起始点检测算法(ODF)确定所述分帧处理所得到的各分帧中的关键帧;得到所述关键帧的音频指纹,并根据所得到的音频指纹进行检索,得到对应所述音频片段的音频文件信息。2.根据权利要求1所述音频指纹检索方法,其特征在于,所述通过起始点检测算法确定所述音频信号各分帧中的关键帧,包括:对所述分帧处理后得到的各分帧进行快速傅氏变换(FFT),并提取所述各分帧的ODF特征参数,根据所述ODF特征参数确定所述各分帧中的关键帧。3.根据权利要求2所述音频指纹检索方法,其特征在于,所述根据所述ODF特征参数确定所述各分帧中的关键帧,具体为:将所述ODF特征参数满足预设ODF阈值条件的分帧确定为关键帧。4.根据权利要求2或3所述音频指纹检索方法,其特征在于,所述提取所述各分帧的ODF特征参数,通过如下的任意一种或多种算法实现:能量算法、差分相位算法、高频分量算法、改进的库尔贝克和莱伯勒散度算法、美尔倒谱系数、线谱对和加权相位差分。5.根据权利要求1所述音频指纹检索方法,其特征在于,所述得到所述关键帧的音频指纹,具体为:基于离散余弦变换(DCT)和最小哈希算法得到所述关键帧的音频指纹。6.根据权利要求5所述音频指纹检索方法,其特征在于,所述基于DCT和最小哈希算法得到所述关键帧的音频指纹,包括:对所述关键帧进行短时的DCT,并保留部分DCT系数;将所保留的DCT系数采用...
【专利技术属性】
技术研发人员:易立夫,张远涛,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。