一种音频文件检测方法及装置制造方法及图纸

技术编号：16287998 阅读：221 留言：0更新日期：2017-09-26 03:54

本发明专利技术公开了一种音频文件检测方法及装置，其中，该方法包括：对待检测音频文件的音频信号的设定维度参数进行归一化处理；对归一化处理后的音频信号进行分片处理；对分片处理后的音频信号进行特征提取，根据提取的特征构建待检测音频文件的特征向量；根据构建的特征向量，查询预建立的音频文件特征库，获取待检测音频文件与特征库中音频文件的相似度。本发明专利技术能够从多维度对待测音频文件进行检测，提升了检测的精度，降低了侵权误判的概率。

Audio file detecting method and device

The invention discloses an audio file detection method and device, wherein, the method includes: setting the dimension parameters of audio signal detection with the audio files are normalized; the audio signal normalized strip; audio signal segment processed according to feature extraction, feature extraction feature vector construction the detected audio files; according to the feature vector construction, feature database query pre established audio files, audio files to obtain similarity detection and audio files in the feature library. The invention can detect the audio and the audio files from multi dimension, thereby improving the detection accuracy and reducing the probability of infringement miscarriage of justice.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频信息处理
，尤其涉及一种音频文件检测方法及装置。
技术介绍
当前互联网上存在着大量未授权的音频文件，这些音频文件涉及教育、娱乐、新闻、广告等多个领域。由于未授权音频文件的存在严重损害了版权音频文件内容提供商和有关各方的利益，阻碍了网络音频产业的健康有序的发展。由于互联网音频文件的数量巨大，格式多样以及各种压缩，水印技术的使用，使的快速检测未授权音频非常困难。现有技术中，传统的音频文件版权的检测方法只能给出待检测音频文件与版权文件相同或不同的结论，对于部分内容侵权的情形不能进行检测，导致误判率高、准确性降低。
技术实现思路
有鉴于此，本专利技术实施例提供一种音频文件检测方法及装置，以优化音频文件的检测技术，有效识别不同程度的音频文件相似情况。第一方面，本专利技术实施例提供了一种音频文件检测方法，包括：对待检测音频文件的音频信号的设定维度参数进行归一化处理；对归一化处理后的音频信号进行分片处理；对分片处理后的音频信号进行特征提取，根据提取的特征构建待检测音频文件的特征向量；根据构建的特征向量，查询预建立的音频文件特征库，获取待检测音频文件与特征库...
一种音频文件检测方法及装置

【技术保护点】
一种音频文件检测方法，其特征在于，包括：对待检测音频文件的音频信号的设定维度参数进行归一化处理；对归一化处理后的音频信号进行分片处理；对分片处理后的音频信号进行特征提取，根据提取的特征构建待检测音频文件的特征向量；根据构建的特征向量，查询预建立的音频文件特征库，获取待检测音频文件与特征库中音频文件的相似度。

【技术特征摘要】
1.一种音频文件检测方法，其特征在于，包括：对待检测音频文件的音频信号的设定维度参数进行归一化处理；对归一化处理后的音频信号进行分片处理；对分片处理后的音频信号进行特征提取，根据提取的特征构建待检测音频文件的特征向量；根据构建的特征向量，查询预建立的音频文件特征库，获取待检测音频文件与特征库中音频文件的相似度。2.根据权利要求1所述的方法，其特征在于，所述获取待检测音频文件与特征库中音频文件的相似度之后，还包括：根据获取的待检测音频文件与特征库中音频文件的相似度，判断待检测音频文件是否侵权。3.根据权利要求1所述的方法，其特征在于，所述对待检测音频文件的音频信号的设定维度参数进行归一化处理包括：对待检测音频文件的音频信号的采样频率、比特率和/或最大振幅进行归一化处理。4.根据权利要求1所述的方法，其特征在于，对归一化处理后的音频信号进行分片处理包括：将归一化处理后的音频信号进行等间隔的时间区间的划分，获取待检测音频文件的音频信号在各个时间区间的音频数据。5.根据权利要求4所述的方法，其特征在于，对分片处理后的音频信号进行特征提取，根据提取的特征构建待检测音频文件的特征向量包括：将待检测音频文件的音频信号在各个区间内的音频数据进行傅里叶变换，获取待检测音频文件在各个区间内的音频信号的频率特征；根据获取的音频信号的频率特征，获取待检测音频文件在各个区间内相对频率特征，所述相对频率特征表征相邻音频信号的频率之间的差值信息；根据获取的音频信号的频率特征，获取待检测音频文件在各个区间内相干频率特征，所述相干频率特征表征相邻音频信号的频率之间倍数信息；根据获取的待检测音频文件在各个时间区间内音频数据中的最大振幅，获取待检测音频文件在各个区间内音频信号的能量特征；分别采用获取的待检测音频文件在各个时间区间内的音频信号的频率特征、相对频率特征、相关频率特征和能量特征构建待检测音频文件的特征向量。6.根据权利要求1所述的方法，其特征在于，所述根据提取的特征向量，查询预建立的音频文件特征库，获取待检测音频文件与特征库中音频文件的相似度，包括：将构建的待检测音频文件的特征向量，分别先后与特征库的第一区域和第二区域内版权音频文件的特征向量进行比对；根据比对结果获取待检测音频文件与特征库中音频文件的相似度；其中，第一区域内版权音频文件特征向量按热度进行排序，第二区域内版权音频文件的特征向量进行二叉排序。7.根据权利要求1所述的方法，其特征在于，所述根据构建的特征向量，查询预建立的音频文件特征库，获取待检测音频文件与特征库中音频文件的相似度，包括：选取与待检测音频文件的应用场景相对应的目标特征向量，将待检测音频文件的目标特征向量与特征库的版权音频文件中与目标特征向量相对应的特征向量进行比对，获取目标特征向量的相似度；确定特征库中与待检测音频文件的目标特征向量的相似度最大的目标音频文件，将目标音频文件未比对的特征向量与待检测音频文件的非目标特征向量进行比对，分别获取待检测音频文件非目标特征向量的相似度；根据获取的待检测音频文件特征向量的相似度，获取待检测音频文件与特征库中音频文件的相似度。8.根据权利要求7所述的方法，其特征在于，所述根据获取的待检测音频文件特征向量的相似度，获取待检测音频文件与特征库中音频文件的相似度，包括：根据获取的待检测音频文件特征向量的相似度及预设特征向量相似度的权重，获取待检测音频文件与特征库中音频文件的相似度。9.根据权利要求7所述的方法，其特征在于，所述根据获取的待检测音频文件特征向量的相似度，获取待检测音频文件与特征库中音频文件的相似度，包括：将样本音频文件特征向量的相似度输入到训练模型，以对预设的特征向量相似度的权重进行调整；根据获取的待检测音频文件特征向量的相似度以及调整之后的特征向量相似度的权重，获取待检测音频...

【专利技术属性】
技术研发人员：郭伟，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人