一种音频指纹的提取方法及系统技术方案

技术编号:10701732 阅读:67 留言:0更新日期:2014-12-03 10:47
本发明专利技术提供了一种音频指纹的提取方法,包括:音频客户端对原始的音频数据进行降采样处理,得到低频带的音频数据,并对低频带的音频数据进行量化编码处理,得到编码值,将所述编码值发送到服务器;服务器对收到的编码值进行逆量化解码处理,得到重建的音频数据,从重建的音频数据中提取音频指纹;本发明专利技术还提供一种音频指纹的提取系统。据本发明专利技术提供的技术方案,在降低音频数据的传输量的同时提高从音频数据中提取的音频指纹的准确率。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种音频指纹的提取方法,包括:音频客户端对原始的音频数据进行降采样处理,得到低频带的音频数据,并对低频带的音频数据进行量化编码处理,得到编码值,将所述编码值发送到服务器;服务器对收到的编码值进行逆量化解码处理,得到重建的音频数据,从重建的音频数据中提取音频指纹;本专利技术还提供一种音频指纹的提取系统。据本专利技术提供的技术方案,在降低音频数据的传输量的同时提高从音频数据中提取的音频指纹的准确率。【专利说明】一种音频指纹的提取方法及系统
】本专利技术涉及互联网应用领域,尤其涉及一种音频指纹的提取方法及系统。【
技术介绍
】当用户使用音乐播放器播放本地音频时或当用户在音乐播放器中输入一段音频时,可以利用音频指纹技术从互联网的音频数据库中获得歌名、歌手、专辑名等音频信息,还可以获得高质量的正版音频资源。音频指纹技术中,需要为每一首歌曲编制特征码,用以实现歌曲的精确匹配和识别,为广大用户提供音频识别服务。目前,利用音频指纹技术从音频数据库中获得音频或音频信息时,需要由音频客户端(如音乐播放器软件、MP3播放器等)将压缩后的音频数据通过互联网上传到服务器,由服务器从音频数据中提取音频指纹,再依据提取的音频指纹在音频数据库中进行匹配,识别出音频或音频信息;其中,音频客户端利用wma编码器对原始的音频数据进行编码,得到wma格式的音频数据。wma编码器是基于模型的编码方式,虽然能够提高音频数据的压缩t匕,降低数据传输量,但也会丢失很多音频数据,使得提取的音频指纹准确率较低,最终将导致服务器的识别结果的准确率较低;而且,wma编码器的编码过程非常复杂,需要进行大量运算,产生大量数据,因此无法在各种移动终端中应用,使得音频客户端存在局限性。【
技术实现思路
】本专利技术提供了一种音频指纹的提取方法及系统,能够在降低音频数据的传输量的同时提高从音频数据中提取的音频指纹的准确率。本专利技术的具体技术方案如下:根据本专利技术一优选实施例,一种音频指纹的提取方法,包括:音频客户端对原始的音频数据进行降采样处理,得到低频带的音频数据,并对低频带的音频数据进行量化编码处理,得到编码值,将所述编码值发送到服务器;服务器对收到的编码值进行逆量化解码处理,得到重建的音频数据,从重建的音频数据中提取音频指纹。上述方法中,所述对原始的音频数据进行降采样处理具体为:将原始的音频数据通过截止频率为1/M的低通滤波器,然后每M个样点抽取一个样点,得到样点的采样值,所述采样值为低频带的音频数据;其中,M为正整数。上述方法中,所述对低频带的音频数据进行量化编码处理具体为:计算当前输入的采样值与预设的预测采样值之间的差值;利用存储的上一个采样值的量化步长索引查询预设的步长调整表,得到量化步长,如果所述差值为负数,则4位的编码值中的第3位的值设置为1,反之,设置为O ;如果所述差值大于量化步长,则4位的编码值中的第2位的值设置为I,反之,设置为O ;如果差值与量化步长的差值大于二分之一的量化步长,则4位的编码值中的第I位的值设置为1,反之,设置为O ;如果差值减去量化步长再减去二分之一的量化步长后大于四分之一的量化步长,则4位的编码值中的第O位的值设置为I,反之,设置为O。上述方法中,该方法还包括:利用得到的编码值查询预设的索引调整表,得到量化步长索引,将所述量化步长索引与存储的量化步长索引相加,得到新的量化步长索引,存储新的量化步长索引,所述新的量化步长索引在对下一个采样值进行量化编码时用于查询步长调整表。上述方法中,所述对收到的编码值进行逆量化解码处理具体为:利用预设的量化步长索引查询步长调整表,得到量化步长;依据所述量化步长对当前的编码值进行逆量化处理,得到差值;将预设的预测解码值与差值相加得到解码值,所述解码值为重建的音频数据。上述方法中,该方法还包括:存储所述解码值,所述解码值作为新的预测解码值;用当前编码值调整量化步长索引,存储新的量化步长索引,所述新的量化步长索引用于进行下一个编码值的逆量化解码处理。一种音频指纹的提取系统,包括:音频客户端、服务器;其中,音频客户端,用于对原始的音频数据进行降采样处理,得到低频带的音频数据,并对低频带的音频数据进行量化编码处理,得到编码值,将所述编码值发送到服务器;服务器,用于对收到的编码值进行逆量化解码处理,得到重建的音频数据,从重建的音频数据中提取音频指纹。上述系统中,所述音频客户端进一步包括:重采样单元,用于将原始的音频数据通过截止频率为1/M的低通滤波器,然后每M个样点抽取一个样点,得到样点的采样值,所述采样值为低频带的音频数据;其中,M为正整数。上述系统中,所述音频客户端还包括:ADPCM编码单元,用于计算当前输入的采样值与预设的预测采样值之间的差值;利用存储的上一个采样值的量化步长索引查询预设的步长调整表,得到量化步长,如果所述差值为负数,则4位的编码值中的第3位的值设置为1,反之,设置为O ;如果所述差值大于量化步长,则4位的编码值中的第2位的值设置为1,反之,设置为O ;如果差值与量化步长的差值大于二分之一的量化步长,则4位的编码值中的第I位的值设置为1,反之,设置为O ;如果差值减去量化步长再减去二分之一的量化步长后大于四分之一的量化步长,则4位的编码值中的第O位的值设置为1,反之,设置为O。上述系统中,所述ADPCM编码单元,还用于利用得到的编码值查询预设的索引调整表,得到量化步长索引,将所述量化步长索引与存储的量化步长索引相加,得到新的量化步长索引,存储新的量化步长索引,所述新的量化步长索引在对下一个采样值进行量化编码时用于查询步长调整表。上述系统中,所述服务器进一步包括:ADPCM解码单元,用于利用预设的量化步长索引查询步长调整表,得到量化步长;依据所述量化步长对当前的编码值进行逆量化处理,得到差值;将预设的预测解码值与差值相加得到解码值,所述解码值为重建的音频数据。上述系统中,所述ADPCM解码单元,还用于存储所述解码值,所述解码值作为新的预测解码值;用当前编码值调整量化步长索引,存储新的量化步长索引,所述新的量化步长索引用于进行下一个编码值的逆量化解码处理。由以上技术方案可以看出,本专利技术提供的具有以下有益效果:对原始的音频数据进行降采样处理,实现在保留了最重要的音频数据的同时去除了多余的其他频带的音频数据,从而减少音频客户端的处理数据量和传输数据量,提高音频客户端的工作效率,使得更多的移动终端能够支持这种音频客户端,提高音频客户端的应用范围;而且,利用对音频数据进行量化编码后发送到服务器,在对音频数据进行压缩的同时可以最大程度的保存原始的音频数据的音频信息,从而有利于音频数据中音频指纹的提取,提闻提取的首频指纹的准确率,进而提闻服务器的识别准确率。【【专利附图】【附图说明】】图1是本专利技术实现音频指纹的提取系统的优选实施例的结构示意图;图2是本专利技术实现音频指纹的提取方法的优选实施例的流程示意图;图3是本专利技术中提取的音频指纹的示例图。【【具体实施方式】】本专利技术的基本思想是:音频客户端对原始的音频数据进行降采样处理,得到低频带的音频数据,并对低频带的音频数据进行量化编码处理,得到编码值,将所述编码值发送到服务器;服务器对收到的编码值进行逆量化解码处理,得到重建的本文档来自技高网
...

【技术保护点】
一种音频指纹的提取方法,其特征在于,该方法包括:音频客户端对原始的音频数据进行降采样处理,得到低频带的音频数据,并对低频带的音频数据进行量化编码处理,得到编码值,将所述编码值发送到服务器;服务器对收到的编码值进行逆量化解码处理,得到重建的音频数据,从重建的音频数据中提取音频指纹。

【技术特征摘要】

【专利技术属性】
技术研发人员:田彪
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1