一种确定音频文件的方法和装置制造方法及图纸

技术编号：17779943 阅读：31 留言：0更新日期：2018-04-22 08:34

本发明专利技术实施例公开了一种确定音频文件的方法和装置，属于互联网技术领域。所述方法包括：获取样本音频片段的音频数据，对音频数据进行分帧处理，得到样本音频片段对应的各帧音频数据；提取每帧音频数据的音频特征，得到样本音频片段的每个音频特征；根据预先存储的各音频文件包含的各帧音频数据的音频特征、音频文件标识的对应关系，确定样本音频片段的每个音频特征对应的音频文件标识；根据确定出的每个音频特征对应的音频文件标识，确定候选音频文件；确定述样本音频片段与每个候选音频文件的匹配度，并将对应的匹配度大于预设匹配度阈值的音频文件，确定为包含有样本音频片段的目标音频文件。采用本发明专利技术，可以提高确定音频文件的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种确定音频文件的方法和装置
本专利技术涉及互联网
，特别涉及一种确定音频文件的方法和装置。
技术介绍
随着电子技术和互联网技术的发展，各种各样的终端得到了广泛的应用，相应的，终端中安装的应用程序、实现的功能越来越多，比如，音频播放类应用程序即是一种很常用的应用程序。用户可以通过音频播放类应用程序播放音频文件(比如，播放歌曲)。为便于用户可以通过音频播放类应用程序播放音频文件，音频播放类应用程序的服务器中可以预先存储有包含有大量音频文件的音频库。为了防止音频文件中包含不合格的音频片段(比如包含高危有害内容的音频片段)，技术人员可以对音频库中各音频文件进行检查。具体的，技术人员可以通过音频播放应用程序播放每个音频文件，查看音频文件中是否包含不合格的音频片段。在实现本专利技术的过程中，专利技术人发现现有技术至少存在以下问题：基于上述处理方式，需要技术人员对每一音频文件进行检查来确定包含不合格音频片段的音频文件，往往音频库中包含的音频文件的数量比较大，从而，导致确定音频文件的效率较低。
技术实现思路
为了解决相关技术中存在的确定音频文件的效率较低的问题，本专利技术实施...
一种确定音频文件的方法和装置

【技术保护点】
一种确定音频文件的方法，其特征在于，所述方法包括：获取样本音频片段的音频数据，对所述音频数据进行分帧处理，得到所述样本音频片段对应的各帧音频数据；提取各帧音频数据中的每帧音频数据的音频特征，得到所述样本音频片段的每个音频特征；根据预先存储的各音频文件包含的各帧音频数据的音频特征、音频文件标识的对应关系，确定所述样本音频片段的每个音频特征对应的音频文件标识；根据确定出的每个音频特征对应的音频文件标识，确定候选音频文件；确定所述样本音频片段与每个候选音频文件的匹配度，并将对应的匹配度大于预设匹配度阈值的音频文件，确定为包含有样本音频片段的目标音频文件。

【技术特征摘要】
1.一种确定音频文件的方法，其特征在于，所述方法包括：获取样本音频片段的音频数据，对所述音频数据进行分帧处理，得到所述样本音频片段对应的各帧音频数据；提取各帧音频数据中的每帧音频数据的音频特征，得到所述样本音频片段的每个音频特征；根据预先存储的各音频文件包含的各帧音频数据的音频特征、音频文件标识的对应关系，确定所述样本音频片段的每个音频特征对应的音频文件标识；根据确定出的每个音频特征对应的音频文件标识，确定候选音频文件；确定所述样本音频片段与每个候选音频文件的匹配度，并将对应的匹配度大于预设匹配度阈值的音频文件，确定为包含有样本音频片段的目标音频文件。2.根据权利要求1所述的方法，其特征在于，所述提取各帧音频数据中的每帧音频数据的音频特征，得到所述样本音频片段的每个音频特征，包括：对于所述样本音频片段对应的每帧音频数据，对所述帧音频数据进行频域变换，得到所述帧音频数据对应的频域数据；基于预设的多个不同的频率间隔，对所述频域数据进行分段，得到所述帧音频数据对应的多段频域数据；根据所述帧音频数据对应的多段频域数据，确定所述帧音频数据对应的多段能量，根据所述帧音频数据对应的多段能量、以及相邻帧音频数据对应的多段能量，确定所述帧音频数据的音频特征，得到所述样本音频片段的每个音频特征。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：根据每帧音频数据在所述样本音频片段中的帧位置，确定每个音频特征在样本音频片段中对应的帧位置；所述根据预先存储的各音频文件包含的各帧音频数据的音频特征、音频文件标识的对应关系，确定所述样本音频片段的每个音频特征对应的音频文件标识，包括：根据预先存储的各音频文件包含的各帧音频数据的音频特征、音频文件标识、帧位置的对应关系，确定所述样本音频片段的每个音频特征对应的各音频文件标识-帧位置元组；所述根据确定出的每个音频特征对应的音频文件标识，确定候选音频文件，包括：根据确定出的每个音频特征对应的各音频文件标识-帧位置元组和每个音频特征在样本音频片段中对应的帧位置，确定候选音频文件。4.根据权利要求3所述的方法，其特征在于，所述根据确定出的每个音频特征对应的各音频文件标识-帧位置元组和每个音频特征在样本音频片段中对应的帧位置，确定候选音频文件，包括：对于所述样本音频片段的每个音频特征，根据所述音频特征在所述样本音频片段中对应的帧位置、以及所述音频特征对应的各音频文件标识-帧位置元组，确定各音频文件标识-帧位置元组中的各音频文件标识对应的帧偏移；对于确定出的各音频文件标识中的每个音频文件标识，统计所述音频文件标识对应的每个不同帧偏移对应的音频特征数目，得到所述音频文件标识对应的各帧偏移-音频特征数目元组；根据各音频文件标识对应的各帧偏移-音频特征数目元组，确定对应的各帧偏移-音频特征数目元组中存在音频特征数目达到预设数目阈值的目标音频文件标识；将所述目标音频文件标识对应的音频文件，确定为候选音频文件。5.根据权利要求4所述的方法，其特征在于，所述确定所述样本音频片段与每个候选音频文件的匹配度，包括：对于每个候选音频文件对应的音频文件标识，在所述音频文件标识对应的各帧偏移-音频特征数目元组中，确定对应的音频特征数目大于预设数目阈值的目标帧偏移；基于所述目标帧偏移，在所述候选音频文件中，确定与所述样本音频片段对应的目标音频片段；根据所述样本音频片段的每个音频特征、所述目标音频片段对应的每个音频特征，确定所述样本音频片段与所述目标音频片段的匹配度。6.根据权利要求5所述的方法，其特征在于，音频特征是由预设位数的数字串组成；所述根据所述样本音频片段的每个音频特征、所述目标音频片段对应的每个音频特征，确定所述样本音频片段与所述目标音频片段的匹配度，包括：在所述样本音频片段的每个音频特征、所述目标音频片段对应的每个音频特征中，确定对应位上的数字相同的目标位数；将目标位数在总位数的比值，确定为所述样本音频片段与所述目标音频片段的匹配度，其中，所述总位数是所述预设位数与所述样本音频片段或目标音频片段包含的音频特征的数目的乘积。7.根据权利要求3所述的方法，其特征在于，所述方法还包括：对于预先存储的各音频文件中的每个音频文件，对所述音频文件的音频数据进行分帧处理，得到所述音频文件对应的各帧音频数据；提取所述音频文件对应的每帧音频数据的音频特征，得到所述音频文件的每个音频特征，并确定每个音频特征在所述音频文件中对应的帧位置；根据得到的各音频文件的每个音频特征、以及各音频文件的每个音频特征在各音频文件中对应的帧位置，建立各音频文件包含的各帧音频数据的音频特征、音频文件标识、帧位置的对应关系。8.根据权利要求7所述的方法，其特征在于，所述提取所述音频文件对应的每帧音频数据的音频特征，得到所述音频文件的每个音频特征，包括：对于所述音频文件对应的每帧音频数据，对所述帧音频数据进行频域变换，得到所述帧音频数据对应的频域数据；基于预设的多个不同的频率间隔，对所述频域数据进行分段，得到所述帧音频数据对应的多段频域数据；根据所述帧音频数据对应...

【专利技术属性】
技术研发人员：陈传艺，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人