音频指纹提取方法、服务器、存储介质技术

技术编号:26602254 阅读:37 留言:0更新日期:2020-12-04 21:25
本发明专利技术实施例涉及音频领域,公开了一种音频指纹提取方法、服务器、存储介质。本发明专利技术中,获取音频序列;根据所述音频序列生成频谱图;选取所述频谱图中稳定的极值点作为特征点;取所述特征点的相关极值点作为所述特征点的描述子;通过变换所述描述子修正偏移的所述特征点;将修正后的所述特征点作为所述音频序列的特征;可以在音频失真的情况下也能提取到具有较高精确度的特征。

【技术实现步骤摘要】
音频指纹提取方法、服务器、存储介质
本专利技术实施例涉及音频领域,特别涉及音频指纹提取方法、服务器、存储介质。
技术介绍
本专利技术涉及音频指纹提取技术,音频指纹提取技术是通过特定的算法将一段音频中独一无二的数字特征以标识符的形式提取出来,用于识别海量的声音样本或跟踪定位样本在数据库中的位置。本技术可以适用在声音文件的识别、检索和相似性比对,流媒体广告监播,音乐版权保护,声纹密码识别等多种领域。然而,目前成熟的算法对经过拷贝、传输和转码后的音频指纹提取效果比较好。但是,音频在一定失真情况下,例如,音频是现场录制的或经过变速、变调处理以后,音频指纹技术所提取出来的特征在识别准确性上会大大降低。
技术实现思路
本专利技术实施方式的目的在于提供一种音频指纹提取方法、服务器、存储介质,使得可以在音频失真的情况下也能提取到具有较高精确度的特征。为解决上述技术问题,本专利技术的实施方式提供了一种音频提取方法,包括以下步骤:获取音频序列;根据所述音频序列生成频谱图;选取所述频谱图中稳定的极值点作为特本文档来自技高网...

【技术保护点】
1.一种音频指纹提取方法,其特征在于,包括:/n获取音频序列;/n根据所述音频序列生成频谱图;/n选取所述频谱图中稳定的极值点作为特征点;/n取所述特征点的相关极值点作为所述特征点的描述子;/n通过变换所述描述子修正偏移的所述特征点;/n将修正后的所述特征点作为所述音频序列的特征。/n

【技术特征摘要】
1.一种音频指纹提取方法,其特征在于,包括:
获取音频序列;
根据所述音频序列生成频谱图;
选取所述频谱图中稳定的极值点作为特征点;
取所述特征点的相关极值点作为所述特征点的描述子;
通过变换所述描述子修正偏移的所述特征点;
将修正后的所述特征点作为所述音频序列的特征。


2.根据权利要求1所述的音频指纹提取方法,其特征在于,所述根据所述音频序列生成频谱图,包括:
对所述音频序列加汉宁窗来进行音频预处理;
将所述预处理后的所述音频序列进行分帧;
将所述分帧后的所述音频序列进行傅立叶变化;
根据所述傅立叶变化生成所述频谱图。


3.根据权利要求1所述的音频指纹提取方法,其特征在于,所述选取所述频谱图中稳定的点作为特征点,包括:
对所述频谱图进行对数Log映射;
生成具有所述稳定极值点的所述频谱图。


4.根据权利要求3所述的音频指纹提取方法,其特征在于,在所述对所述频谱图进行对数Log映射前,还包括:
对所述频谱图做10x10的二维高斯滤波。


5.根据权利要求3所述的音频指纹提取方法,其特征在于,在所述对所述频谱图进行对数Log映射后,还包括:
对所述映射后的所述频谱图做水平方向和竖直方向的高斯滤波。

【专利技术属性】
技术研发人员:郑攀峰褚亮亮陈军
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1