一种拖拽音频文件进行音频文件信息检索的方法和装置制造方法及图纸

技术编号：10500060 阅读：75 留言：0更新日期：2014-10-04 16:33

本发明专利技术公开了一种拖拽音频文件进行音频文件信息检索的方法和装置，所述方法包括：检测作用于所述音频文件的拖拽操作；根据所述拖拽操作，获取所述音频文件的音频信号；对所述音频信号进行分帧处理，生成至少一个音频分帧；利用起始点检测算法（ODF）确定所述至少一个音频分帧中的关键帧；提取所述关键帧的音频指纹；利用所述音频指纹在音频指纹数据库中进行检索，获得与所述音频指纹相对应的音频文件的信息。通过本发明专利技术，可以实现无文字输入的检索方式，并且还可以缩短检索时的信息输入时间。

全部详细技术资料下载

【技术实现步骤摘要】
一种拖拽音频文件进行音频文件信息检索的方法和装置
本专利技术涉及音频处理技术，尤其涉及一种拖拽音频文件进行音频文件信息检索的方法和装置。
技术介绍
现有的音频文件(例如歌曲文件)的搜索都是通过手工输入音频文件的名称、音频文件的词曲作者、音频文件的演绎着(例如歌手)或者音乐专辑名等文本信息进行搜索的。然而，如果用户本地有这样的一首歌曲文件，其文件信息已经被破坏，没有歌曲名或歌手名或专辑名，这时，按现有的搜索方法，用户难以查看这首歌的真实信息，下载此歌曲的歌词，或者找到更高品质的相同歌曲等。并且，即使知道这首歌曲的歌曲名、歌手名、专辑名等信息，用户手工输入过于麻烦，容易出错，而且经常搜索出来的结果有很多，要用户自己判别哪个搜索结果才是自己想要的，导致过多的结果筛选耗时。
技术实现思路
有鉴于此，本专利技术提供了一种拖拽音频文件进行音频文件信息检索的方法和装置，来解决以上
技术介绍
部分提到的技术问题。一方面，本专利技术提供了一种拖拽音频文件进行音频文件信息检索的方法，所述方法包括: 检测作用于所述音频文件的拖拽操作；根据所述拖拽操作，获取所述音频文件的音频信号；对所述音频信号进行分帧处理，生成至少一个音频分帧；利用起始点检测算法(ODF)确定所述至少一个音频分帧中的关键帧；提取所述关键巾贞的首频指纹；利用所述音频指纹在音频指纹数据库中进行检索，获得与所述音频指纹相对应的音频文件的信息。对应地，本专利技术还提出了一种拖拽音频文件进行音频文件信息检索的装置，所述装置包括: 检测模块，用于检测作用于所述...

【技术保护点】
一种拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述方法包括：检测作用于所述音频文件的拖拽操作；根据所述拖拽操作，获取所述音频文件的音频信号；对所述音频信号进行分帧处理，生成至少一个音频分帧；利用起始点检测算法（ODF）确定所述至少一个音频分帧中的关键帧；提取所述关键帧的音频指纹；利用所述音频指纹在音频指纹数据库中进行检索，获得与所述音频指纹相对应的音频文件的信息。

【技术特征摘要】
1.一种拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述方法包括: 检测作用于所述音频文件的拖拽操作；根据所述拖拽操作，获取所述音频文件的音频信号；对所述音频信号进行分帧处理，生成至少一个音频分帧；利用起始点检测算法(ODF)确定所述至少一个音频分帧中的关键帧；提取所述关键帧的首频指纹；利用所述音频指纹在音频指纹数据库中进行检索，获得与所述音频指纹相对应的音频文件的信息。2.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述根据所述拖拽操作获取所述音频文件的音频信号的步骤包括:获取由于所述拖拽操作而移动的所述音频文件的当前位置；判断所述当前位置是否落入预设的拖拽处理控件区域；在所述判断的结果为是的情况下，对所述音频文件进行频谱解析，从而生成音频信号。3.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述对所述音频信号进行分帧处理生成至少一个音频分帧的步骤包括:按照预定时间间隔从所述音频信号中提取固定时间长度的频谱图分段，从而得到至少一个音频分帧。4.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述利用起始点检测算法( ODF)确定所述至少一个音频分帧中的关键帧包括:对所述至少一个音频分帧中的各音频分帧进行快速傅里叶变换(FFT);提取所述各音频分帧的ODF特征参数；根据所述ODF特征参数确定所述各音频分帧中的关键帧。5.根据权利要求4所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述根据所述ODF特征参数确定所述各音频分帧中的关键帧包括:将所述ODF特征参数满足预设ODF阈值条件的音频分帧确定为关键帧。6.根据权利要求4-5之一所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述提取所述各音频分帧的ODF特征参数，通过以下算法中的一种算法或一种以上的算法的组合来实现: 能量算法、差分相位算法、高频分量算法、改进的库尔贝克和莱伯勒散度算法、美尔倒谱系数、线谱对和加权相位差分。7.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述提取所述关键帧的音频指纹包括:基于离散余弦变换(DCT)和最小哈希算法得到所述关键帧的音频指纹。8.根据权利要求7所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述基于离散余弦变换(DCT)和最小哈希算法得到所述关键帧的音频指纹，包括:对所述关键帧进行短时的DCT，并保留部分DCT系数；将所保留的DCT系数采用二进制表示；采用最小哈希算法将采用二进制表示的DCT系数转换为音频指纹。9.根据权利要求1所述的拖拽音频文件进行音频文件信息检索的方法，其特征在于，所述音频指纹数据库包括音频指纹和与所述音频指纹相...

【专利技术属性】
技术研发人员：陈剑锋，李深远，赵伟峰，张李伟，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人