音频指纹识别方法、装置、终端设备以及存储介质制造方法及图纸

技术编号：38001426 阅读：14 留言：0更新日期：2023-06-30 10:15

本申请公开了一种音频指纹识别方法、装置、终端设备以及存储介质，其音频指纹识别方法包括：获取全音频数据；对全音频数据进行分帧变换，获得分帧后的各频谱数据；从频谱数据中，选取符合预设目标频率阈值的二维的频带数据；对频带数据进行降维操作，得到全音频数据的一维的音频指纹，基于局部敏感哈希计算改进Philips音频指纹识别方法进行音频指纹识别，即，通过选取全音频数据以获取对应的各频谱数据，并选取符合预设频率的频带数据，进而对频带数据进行降维操作以获得音频指纹，从而可以解决音频指纹识别的准确率低、数据量大的技术问题，提升音频指纹识别的准确率、减小音频指纹的数据量，进而有效用于音频指纹存储以及音频检索去重等领域。频检索去重等领域。频检索去重等领域。

全部详细技术资料下载

【技术实现步骤摘要】
音频指纹识别方法、装置、终端设备以及存储介质

[0001]本申请涉及音频数据处理
，尤其涉及一种音频指纹识别方法、装置、终端设备以及存储介质。

技术介绍

[0002]指纹系统有着悠久的历史，在学术上和工业上都备受关注，例如，在海量样本去重、相似内容检索等领域。
[0003]由于Philips音频指纹识别方法是一种经典的高鲁棒音频指纹识别方法，因此广泛应用至今。
[0004]但是，Philips音频指纹识别方法有以下缺点：一、Philips音频指纹识别方法仅选取了音频中的3秒数据片段进行计算，使得片段指纹无法表示整段音频，导致音频指纹识别的准确率低；二、识别后的音频指纹为数量高达8192(256*32)的二维数组，也即，音频指纹的数据量较大使得音频指纹难以存储和检索。

技术实现思路

[0005]本申请的主要目的在于提供一种音频指纹识别方法、装置、终端设备以及存储介质，旨在解决音频指纹识别的准确率低、数据量大的技术问题，提升音频指纹识别的准确率、减小音频指纹的数据量，进而有效用于音频指纹存储以及音频检索去重等领域。
[0006]为实现上述目的，本申请提供一种音频指纹识别方法，所述音频指纹识别方法包括：
[0007]获取全音频数据；
[0008]对所述全音频数据进行分帧变换，获得分帧后的各频谱数据；
[0009]从所述频谱数据中，选取符合预设目标频率阈值的二维的频带数据；
[0010]对所述频带数据进行降维操作，得到所述全音频数据的一维的音频指纹...

【技术保护点】

【技术特征摘要】
1.一种音频指纹识别方法，其特征在于，所述音频指纹识别方法包括以下步骤：获取全音频数据；对所述全音频数据进行分帧变换，获得分帧后的各频谱数据；从所述频谱数据中，选取符合预设目标频率阈值的二维的频带数据；对所述频带数据进行降维操作，得到所述全音频数据的一维的音频指纹。2.如权利要求1所述的音频指纹识别方法，其特征在于，所述对所述频带数据进行降维操作，得到所述全音频数据的一维的音频指纹的步骤包括：对所述频带数据进行重叠分帧以及能量值计算，获得二维的指纹矩阵；转换所述指纹矩阵，获得所述音频指纹。3.如权利要求2所述的音频指纹识别方法，其特征在于，所述对所述频带数据进行重叠分帧以及能量值计算，获得二维的指纹矩阵的步骤包括：对所述频带数据进行重叠分帧，以选取无重叠的频带数据；分别对所述无重叠的频带数据进行计算，获得对应的能量值；根据预设公式，对所述能量值以及所述无重叠的频带数据进行计算，获得所述指纹矩阵。4.如权利要求2所述的音频指纹识别方法，其特征在于，所述转换所述指纹矩阵，获得所述音频指纹的步骤包括：对所述指纹矩阵进行纵向求和，得到一维的权重矩阵；根据预设符号函数，对所述权重矩阵进行计算，得到所述音频指纹。5.如权利要求1所述的音频指纹识别方法，其特征在于，所述从所述频谱数据中，选取符合预设目标频率阈值的二维的频带数据的步骤之前，还包括：获取初始频率阈值；根据预设敏感条件，对所述初始频率阈值进行优化，得到所述目标频率阈值。6.如权利要求1所述的音频指纹识别方法，其特征在于，所述对所述全音频数据进行分...

【专利技术属性】
技术研发人员：董家林，
申请(专利权)人：招商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人