音频指纹检索库的更新方法及系统技术方案

技术编号:6983374 阅读:648 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种音频指纹检索库的更新方法及和系统,所述方法包括:将所有老歌曲的音频指纹和检索索引存入一基本检索库;将新歌曲的音频指纹和检索索引更新入一增量检索库;判断所述增量检索库的大小是否大于或等于预设的阈值,如是,则将所述增量检索库与基本检索库合并生成新的基本检索库,再将新歌曲的音频指纹和检索索引更新入一新的增量检索库;如否,则将新歌曲的音频指纹和检索索引更新入所述增量检索库。本发明专利技术针对经常有新歌曲加入的情况,当增量检索库比较小,更新增量检索库的代价非常小时,则每次只对增量检索库进行更新,从而节约了对音频指纹检索库的更新时间,实现了对音频指纹检索库的快速更新。

【技术实现步骤摘要】

本专利技术涉及音频指纹检索
,特别涉及一种音频指纹检索库的更新方法及系统
技术介绍
目前,用户经常会遇到这样的情况,当听到一首非常好听的歌曲但由于不知道这首歌曲的名字,无法通过各种渠道(如网络下载或到音像制品店购买)获取这首歌曲。为帮助找到某首歌曲的歌名称,于是业界出现了一种音频指纹检索库技术来解决这个问题,简单来说,这种音频指纹检索库技术的基本原理是先录制一段时间(通常为几秒钟)想知道歌名的歌曲的声音,然后将录制的这几秒钟的声音转化成音频指纹,这种音频指纹可以是从声音(音频)中提取的一系列数字特征,这些特征可以被发送到服务器与事先存储在服务器上的指纹库的音频指纹内容进行比对和检索,从而可以找到对应的歌曲,这与谷歌、百度等搜索引擎的应用原理类似,只是对于搜索引擎而言,提交到服务器的是一些文本关键词,而对于音频指纹的检索而言,提交到服务器的是一系列音频指纹。但是,这种音频指纹检索库技术目前面临的最大问题是它的更新问题,为了保证后续对音频指纹的快速检索,当曲库中有新的曲目加入时,新的曲库转化为音频指纹后不能将这这个音频指纹简单地附加在现有的音频指纹检索库的后面,而是必须重新生成便于检索的新的音频指纹检索库,然而对于一个已经拥有上百万首歌曲的音频指纹的检索库而言,其更新耗时会相当长,因而无法做到每天对其进行及时而快速更新。
技术实现思路
本专利技术的目的在于提供一种音频指纹检索库的更新方法及系统,该方法能实现对音频指纹检索库的快速更新,并且减少的更新时间,提高更新效率。为解决上述问题,本专利技术提供一种音频指纹检索库的更新方法,包括将所有老歌曲的音频指纹和检索索引存入一基本检索库;将新歌曲的音频指纹和检索索引更新入一增量检索库;判断所述增量检索库的大小是否大于或等于预设的阈值,如是,则将所述增量检索库与基本检索库合并生成新的基本检索库,再将新歌曲的音频指纹和检索索引更新入一新的增量检索库;如否,则将新歌曲的音频指纹和检索索引更新入所述增量检索库。进一步的,在上述方法中,所述音频指纹包括若干个音频指纹序列,所述音频指纹序列是将固定长度的声音片断转化成的固定位数的整数。进一步的,在上述方法中,所述基本检索库和增量检索库均包括检索索引表和随机指纹库,所述检索索引表存储有每首老歌曲或新歌曲的检索索引,所述随机指纹库存储有每首老歌曲或新歌曲的音频指纹,每个音频指纹包括若干音频指纹序列。进一步的,在上述方法中,所述检索索引表包括顺序索引表和顺序数据表。进一步的,在上述方法中,所述顺序数据表存储有对应于每个所述音频指纹序列的数据块。进一步的,在上述方法中,所述数据块包括ID数据和偏移量数据,所述ID数据记录可能对应于所述音频指纹序列的所有随机指纹库的音频指纹的ID,所述偏移量数据记录有所述音频指纹序列在所述随机指纹库的音频指纹中的偏移量。进一步的,在上述方法中,所述顺序索引表存储有所有音频指纹序列以及指向对应于所述音频指纹序列的数据块的指针。进一步的,在上述方法中,所述顺序索引表是按音频指纹序列的整数值由小到大组成的线性表。进一步的,在上述方法中,所述将新歌曲的音频指纹和检索索引更新入一增量检索库的步骤包括将新歌曲的音频指纹加入增量检索库的随机指纹库;将新歌曲的所有音频指纹的音频指纹序列存储入增量检索库的顺序索引表;将与每个所述音频指纹序列可能对应的所有增量检索库的随机指纹库的音频指纹的ID以及所述音频指纹序列在所述增量检索库的随机指纹库的音频指纹中的偏移量记录入所述增量检索库的顺序数据表;将所述增量检索库的顺序索引表中每个对应于所述音频指纹序列的指针指向所述增量检索库顺序数据表的对应的数据块。进一步的,在上述方法中,所述阈值为存储的数据量或存储的歌曲的个数。进一步的,在上述方法中,将所述增量检索库与基本检索库合并生成新的基本检索库的步骤包括将增量检索库的随机指纹库与基本检索库的随机指纹库合并生成新的基本检索库的随机指纹库;将增量检索库的顺序索引表的与基本检索库的顺序索引表合并生成新基本检索库的顺序索引表;从新的基本检索库的顺序索引表中的第一个音频指纹序列开始逐个根据新的基本检索库的顺序索引表中音频指纹序列的对应的数据块的指针,从所述基本检索库的数据索引表和所述增量检索库的数据索引表中调取并合并对应于新的顺序索引表的音频指纹序列的数据块,并将合并后的数据块存储入新的基本检索库的数据索引表中;再修改所述合并后的数据块中的ID数据和偏移量数据,使所述ID数据为新的基本检索库的随机指纹库的所有可能对应于所述音频指纹序列的音频指纹的ID,所述偏移量数据为新的基本检索库的随机指纹库中所述音频指纹序列在所述音频指纹中的偏移量,并将新的基本检索库的顺序索引表的对应于所述音频指纹序列的指针修改为指向新的基本检索库的数据索引表的所述合并后的数据块。根据本专利技术的另一面,提供一种音频指纹检索库的更新系统,包括基本检索库,用于存储所有老歌曲的音频指纹和检索索引;增量检索库,用于存储新歌曲的音频指纹和检索索引;新的基本检索库,用于存储基本检索库和增量检索库合并后的内容;阈值判定模块,用于判定增量检索库的大小是否大于或等于预设的阈值;生成模块,用于生成基本检索库和增量检索库、更新增量检索库以及将所述基本检索库和增量检索库进行合并。进一步的,在上述系统中,所述生成模块包括基本生成单元,用于生成基本检索库并将所有老歌曲的音频指纹和检索索引存入基本检索库;增量生成单元,用于生成增量检索库并将新歌曲的音频指纹和检索索引更新入增量检索库;合并单元,用于将所述基本检索库和增量检索库进行合并。进一步的,在上述系统中,所述音频指纹包括若干个音频指纹序列,所述音频指纹序列是将固定长度的声音片断转化成的固定位数的整数。进一步的,在上述系统中,所述基本检索库和增量检索库均包括检索索引表和随机指纹库,所述检索索引表存储有每首老歌曲或新歌曲的检索索引,所述随机指纹库存储有每首老歌曲或新歌曲的音频指纹,每个音频指纹包括若干音频指纹序列。进一步的,在上述系统中,所述检索索引表包括顺序索引表和顺序数据表。进一步的,在上述系统中,所述顺序数据表存储有对应于每个所述音频指纹序列的数据块。进一步的,在上述系统中,所述数据块包括ID数据和偏移量数据,所述ID数据记录有可能对应于所述音频指纹序列的所有随机指纹库的音频指纹的ID,所述偏移量数据记录有所述音频指纹序列在所述随机指纹库的音频指纹中的偏移量。进一步的,在上述系统中,所述顺序索引表存储有所有音频指纹序列以及指向对应于所述音频指纹序列的数据块的指针。进一步的,在上述系统中,所述顺序索引表是按音频指纹序列的整数值由小到大组成的线性表。进一步的,在上述系统中,所述阈值为存储的数据量或存储的歌曲的个数。与现有技术相比,本专利技术的音频指纹检索库的更新方法及系统,具有以下有益效果本专利技术通过将所有老歌曲的音频指纹和检索索引存入基本检索库,将新歌曲的音频指纹和检索索引加入增量检索库,提供了一种基于基本检索库和增量检索库的更新方法,针对经常有新歌曲加入的情况,当增量检索库比较小,更新增量检索库的代价非常小时,则每次只对增量检索库进行更新,从而节约了对音频指纹检索库的更新时间,实现了对音频指纹检索库的快速更新,而且用户不仅可以在已存在的海量基本检本文档来自技高网...

【技术保护点】
1.一种音频指纹检索库的更新方法,其特征在于,包括:将所有老歌曲的音频指纹和检索索引存入一基本检索库;将新歌曲的音频指纹和检索索引更新入一增量检索库;判断所述增量检索库的大小是否大于或等于预设的阈值,如是,则将所述增量检索库与基本检索库合并生成新的基本检索库,再将新歌曲的音频指纹和检索索引更新入一新的增量检索库;如否,则将新歌曲的音频指纹和检索索引更新入所述增量检索库。

【技术特征摘要】

【专利技术属性】
技术研发人员:李霄寒王磊
申请(专利权)人:盛乐信息技术上海有限公司
类型:发明
国别省市:31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1