音频匹配方法，电子设备及存储介质组成比例

技术编号：25443446 阅读：20 留言：0更新日期：2020-08-28 22:30

本申请公开了一种音频匹配方法，电子设备及存储介质。该方法包括：获取待处理音频；按照划分方式将待处理音频划分为多个第一音频帧，其中相邻两个第一音频帧部分重叠；对每个第一音频帧进行傅里叶变换得到每个第一音频帧的频谱；基于第一音频帧的频谱，得到待处理音频的多个频谱峰值特征指纹；将待处理音频的多个频谱峰值特征指纹与数据库音频的多个频谱峰值特征指纹进行动态滑窗匹配检索，得到待处理音频的匹配结果。通过上述方式，本申请能够得到更加准确的待处理音频匹配结果。

全部详细技术资料下载

【技术实现步骤摘要】
音频匹配方法，电子设备及存储介质
本申请涉及数据处理领域，特别是涉及一种音频匹配方法，电子设备及存储介质。
技术介绍
近年来，互联网音视频数据海量增加，音视频数据相比于其他形式的数据具有信息传播速度快、用户创造内容等特点。这些音视频数据在给我们的生活带来极大便利的同时也伴随着网络犯罪等情况的发生。现有技术中，一般采用自动匹配方法来从海量的音视频数据中获取如涉网犯罪的信息。然而，现有的自动匹配方法得到的结果不够准确。
技术实现思路
本申请提供一种音频匹配方法，电子设备及存储介质，能够解决现有的自动匹配方法得到的结果不够准确的问题。为解决上述技术问题，本申请采用的一个技术方案是：提供一种音频匹配方法，该方法包括：获取待处理音频；按照划分方式将待处理音频划分为多个第一音频帧，其中相邻两个第一音频帧部分重叠；对每个第一音频帧进行傅里叶变换得到每个第一音频帧的频谱；基于第一音频帧的频谱，得到待处理音频的多个频谱峰值特征指纹；将待处理音频的多个频谱峰值特征指纹与数据库音频的多个频谱峰值特征指纹进行动态滑窗匹配检索，得到待处理音频的匹配结果。为解决上述技术问题，本申请采用的另一个技术方案是：提供一种电子设备，该电子设备包括处理器、与处理器连接的存储器，该存储器存储有程序指令；处理器用于执行存储器存储的所述程序指令以实现上述方法。为解决上述技术问题，本申请采用的再一个技术方案是：提供一种存储介质，存储有程序指令，该程序指令被执行时能够实现上述方法。本申请的有益效果是：本申请将待处理...

【技术保护点】
1.一种音频匹配方法，其特征在于，包括：/n获取待处理音频；/n按照划分方式将所述待处理音频划分为多个第一音频帧，其中相邻两个所述第一音频帧部分重叠；/n对每个所述第一音频帧进行傅里叶变换得到每个所述第一音频帧的频谱；/n基于所述第一音频帧的频谱，得到所述待处理音频的多个频谱峰值特征指纹；/n将所述待处理音频的多个频谱峰值特征指纹与数据库音频的多个频谱峰值特征指纹进行动态滑窗匹配检索，得到所述待处理音频的匹配结果。/n

【技术特征摘要】
1.一种音频匹配方法，其特征在于，包括：
获取待处理音频；
按照划分方式将所述待处理音频划分为多个第一音频帧，其中相邻两个所述第一音频帧部分重叠；
对每个所述第一音频帧进行傅里叶变换得到每个所述第一音频帧的频谱；
基于所述第一音频帧的频谱，得到所述待处理音频的多个频谱峰值特征指纹；
将所述待处理音频的多个频谱峰值特征指纹与数据库音频的多个频谱峰值特征指纹进行动态滑窗匹配检索，得到所述待处理音频的匹配结果。

2.根据权利要求1所述的方法，其特征在于，所述将所述待处理音频的多个频谱峰值特征指纹与数据库音频的多个频谱峰值特征指纹进行动态滑窗匹配检索，得到所述待处理音频的匹配结果之前，包括：
获取所述数据库音频的多个频谱峰值特征指纹。

3.根据权利要求2所述的方法，其特征在于，所述获取所述数据库音频的多个频谱峰值特征指纹包括：
按照所述划分方式将所述数据库音频划分为多个第二音频帧，其中相邻两个所述第二音频帧部分重叠；
对每个所述第二音频帧进行傅里叶变换，得到每个所述第二音频帧的频谱；
基于所述第二音频帧的频谱，得到所述数据库音频的多个频谱峰值特征指纹。

4.根据权利要求1所述的方法，其特征在于，所述按照划分方式将所述待处理音频划分为多个第一音频帧包括：
确定划分参数，所述划分参数包括所述第一音频帧的时长以及相邻两个所述第一音频帧之间的时间间隔；
按照所述划分参数将所述待处理音频划分为多个第一音频帧。

5.根据权利要求1所述的方法，其特征在于，
每个所述待处理音频的所述频谱峰值特征指纹由两个不同所述第一音频帧的频谱峰值点组成。

6.根据权利要求1所述的方法，其特征在于，
所述将所述待处理音频的多个频谱峰值特征指纹与数据库音频的多个频谱峰值特征指纹进行动态滑窗匹配检索，得到所述待处理音频的匹配结果包括：
分别为每个所述第一音频帧的频谱峰值特征指纹进行动态滑窗匹配检索，得到每个所述第一音频帧的匹配结果；
合并所述每个所述第一音频帧的匹配结果，得到所述待处理音频的匹配结果。

7.根据权利要求6所述的方法，其特征在于，
所述分别为每个所述第一音频帧的频谱峰值特征指纹进行动态滑窗匹配检索，得到每个所述第一音频帧的匹...

【专利技术属性】
技术研发人员：钟奥，王建社，冯祥，查飞，余巍，董德武，张建忠，程彪，
申请(专利权)人：讯飞智元信息科技有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人