比较音频文件和音频样本的方法、系统和计算机可读介质技术方案

技术编号：32437290 阅读：31 留言：0更新日期：2022-02-26 07:55

本发明专利技术涉及一种用于比较音频文件和音频样本的方法，包括：S101：获得所述音频文件的复数频率谱；S102：获得所述音频文件与一变形音频的自相干序列，其中所述变形音频是基于所述音频文件获得的；S103：获得所述音频样本与所述音频文件的相干性时间序列；S104：以所述自相干序列为去卷积核，对所述相干性时间序列进行去卷积处理；S105：根据去卷积后的相干性时间序列，定位所述音频文件和/或所述音频样本。本发明专利技术的上述实施例中，将音频样本与所述音频文件的相干性时间序列，采用音频文件的自相干时间序列去卷积，能够更精确定位检索到的音频时间位置。经过实际验证，本发明专利技术的实施例在实际复杂场景下(例如低信噪比的环境中)验证具有很好的鲁棒性。有很好的鲁棒性。有很好的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
比较音频文件和音频样本的方法、系统和计算机可读介质

[0001]本专利技术大致涉及音频信号处理领域，尤其涉及比较音频文件和音频样本的方法、系统和计算机可读介质。

技术介绍

[0002]经常需要在声音样本的数据库中寻找与一小段音频相匹配的样本，例如一些网站提供了这样的服务：通过输入或上传一小段音乐音频，能够在一个百万首量级的音乐数据库中快速检索匹配以找到包括用户上传的小段音乐音频的整首音乐样本。为了达到这个目的，现有的一些算法对被检索的音频和数据库中的音乐都做了紧致的声音纹理提取。虽然在环境相对安静情况下，该算法可以对声音模式做快速匹配，但因为该算法对声音纹理的特征提取的紧致性，它对周围不相干环境声音的影响敏感。在噪声源存在和低信噪比条件下，该算法对检索的声音模式的鲁棒性有缺陷。因此现有技术中需要提供一种方案，其能够在一个复杂声学环境中，在噪声源存在且信噪比较低的情况下，稳定的检测音频播放设备有无播放被检测的音频并定位其播放时间。
[0003]
技术介绍
部分的内容仅仅是专利技术人所知晓的技术，并不当然代表本领域的现有技术。

技术实现思路

[0004]有鉴于现有技术的至少一个缺陷，本专利技术提供一种用于识别音频样本的方法，包括：
[0005]S102：获得音频文件与一变形音频的自相干序列，其中所述变形音频是基于所述音频文件获得的；
[0006]S103：获得所述音频样本与所述音频文件的相干性时间序列；
[0007]S104：以所述自相干序列为去卷积核，对所述相干性时间序列进行...

【技术保护点】

【技术特征摘要】
1.一种用于识别音频样本的方法，包括：S102：获得音频文件与一变形音频的自相干序列，其中所述变形音频是基于所述音频文件获得的；S103：获得所述音频样本与所述音频文件的相干性时间序列；S104：以所述自相干序列为去卷积核，对所述相干性时间序列进行去卷积处理；S105：根据去卷积后的相干性时间序列，识别和/或定位所述音频文件和/或所述音频样本。2.如权利要求1所述的方法，其中所述变形音频包括在所述音频文件的前部和/或后部插入静音段，或者所述变形音频包括在所述音频文件的前部和/或后部插入所述音频文件。3.如权利要求1或2所述的方法，还包括步骤S101：获得所述音频文件的复数频率谱。4.如权利要求1或2所述的方法，其中所述音频样本的长度大于所述音频文件的长度，所述步骤S103包括通过滑动窗口法获得所述相干性时间序列，所述滑动窗口的宽度与所述音频文件的长度相同，所述步骤S103包括：S103-1：将所述音频样本在所述滑动窗口内的部分，与所述音频文件进行比较，获得相干性指数；S103-2：将所述滑动窗口滑过所述音频样本，重复所述步骤S103-1，获得所述相干性时间序列。5.如权利要求4所述的方法，其中所述相干性指数为所述音频样本在所述滑动窗口内的部分与所述音频文件在每个频率上的相干性系数的频率加权平均值。6.如权利要求1或2所述的方法，其中所述音频样本的长度小于所述音频文件的长...

【专利技术属性】
技术研发人员：张泽琛，任洲，华刚，
申请(专利权)人：虫极科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人