一种音频数据处理方法、装置以及计算机可读存储介质制造方法及图纸

技术编号：24996216 阅读：32 留言：0更新日期：2020-07-24 17:58

本申请公开了一种音频数据处理方法、装置以及计算机可读存储介质，该方法包括：获取目标音频的片段频谱序列；片段频谱序列是对目标音频的音频片段的能量幅值进行采样得到；根据片段频谱序列生成目标音频的整体频谱序列；根据频谱表示基函数生成初始拟合频谱函数，对频谱表示基函数进行调整，得到调整后的初始拟合频谱函数；当调整后的初始拟合频谱函数与整体频谱序列之间满足收敛条件时，根据调整后的初始拟合频谱函数获取调整后的至少两个频谱表示基函数作为频谱重构基函数；根据频谱重构基函数，对片段频谱序列进行重构，根据重构后的片段频谱序列确定目标音频的音频表示向量。采用本申请，可提高所获取到的目标音频的音频表示向量的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频数据处理方法、装置以及计算机可读存储介质
本申请涉及音频数据处理的
，尤其涉及一种音频数据处理方法、装置以及计算机可读存储介质。
技术介绍
听音乐是一项全民活动，现今网络上音乐的数量日渐增多，其中包括多种风格的音乐、多种形式的音乐以及多个歌手的音乐等。因此，用户很难在这众多的音乐中选择想要播放的音乐，这就需要借助系统来为用户检索其可能感兴趣的音乐，再将检索到的音乐推荐给用户。其中，在为用户推荐音乐时，可以将检索到的与用户标记为喜欢的音乐A相似的音乐B推荐给用户。此间过程中，涉及到在音乐库中的多个音乐中检索与音乐A相似的音乐B的过程，而在开始这个过程之前，需要先将音乐A和音乐库中的每个音乐都转换为机器语言(例如将音乐表示为向量)，才可在音乐库中检索与音乐A相似的音乐。现有技术中，通常是直接对每个音乐中的能量幅值进行采样，通过采样所得到的序列来生成每个音乐的音乐表示向量。但是，很多时候在一个音乐中通常会有时刻t1的能量幅值很大，而其他时刻的能量幅值都相对较小，或者时刻t2的能量幅值很小，而其...

【技术保护点】
1.一种音频数据处理方法，其特征在于，包括：/n获取目标音频的至少两个片段频谱序列；所述至少两个片段频谱序列是对所述目标音频的至少两个音频片段的能量幅值进行采样得到；/n根据所述至少两个片段频谱序列分别所包含的能量幅值，生成所述目标音频的整体频谱序列；/n根据至少两个频谱表示基函数，生成初始拟合频谱函数，对所述至少两个频谱表示基函数进行调整，得到调整后的初始拟合频谱函数；/n当所述调整后的初始拟合频谱函数与所述整体频谱序列之间满足收敛条件时，根据所述调整后的初始拟合频谱函数，获取调整后的至少两个频谱表示基函数作为频谱重构基函数；/n根据所述频谱重构基函数，对所述至少两个片段频谱序列进行重构，得...

【技术特征摘要】
1.一种音频数据处理方法，其特征在于，包括：
获取目标音频的至少两个片段频谱序列；所述至少两个片段频谱序列是对所述目标音频的至少两个音频片段的能量幅值进行采样得到；
根据所述至少两个片段频谱序列分别所包含的能量幅值，生成所述目标音频的整体频谱序列；
根据至少两个频谱表示基函数，生成初始拟合频谱函数，对所述至少两个频谱表示基函数进行调整，得到调整后的初始拟合频谱函数；
当所述调整后的初始拟合频谱函数与所述整体频谱序列之间满足收敛条件时，根据所述调整后的初始拟合频谱函数，获取调整后的至少两个频谱表示基函数作为频谱重构基函数；
根据所述频谱重构基函数，对所述至少两个片段频谱序列进行重构，得到重构片段频谱序列；所述重构片段频谱序列用于确定所述目标音频的音频表示向量。

2.根据权利要求1所述的方法，其特征在于，所述获取目标音频的至少两个片段频谱序列，包括：
根据采样时间间隔，对所述目标音频的能量幅值进行采样，得到所述目标音频对应的能量时间序列；
根据采样时间段对所述能量时间序列进行切分，得到所述能量时间序列所包含的至少两个片段能量时间序列；
根据所述至少两个片段能量时间序列，生成所述至少两个片段频谱序列。

3.根据权利要求2所述的方法，其特征在于，所述根据所述至少两个片段能量时间序列，生成所述至少两个片段频谱序列，包括：
分别对所述至少两个片段能量时间序列进行频域变换，得到每个片段能量时间序列对应的片段频率信号；
根据采样频率间隔分别对每个片段频率信号进行采样，得到所述每个片段频率信号对应的片段频率序列；
将所述每个片段频率信号对应的片段频率序列，均确定为所述目标音频的片段频谱序列。

4.根据权利要求1所述的方法，其特征在于，所述至少两个片段频谱序列中的每个片段频谱序列中均包括至少两个采样频率分别对应的能量幅值；
所述根据所述至少两个片段频谱序列分别所包含的能量幅值，生成所述目标音频的整体频谱序列，包括：
将所述每个片段频谱序列中，属于相同采样频率的能量幅值进行求和，得到每个采样频率分别对应的求和能量幅值；
根据所述每个采样频率分别对应的求和能量幅值，生成所述目标音频的所述整体频谱序列。

5.根据权利要求4所述的方法，其特征在于，所述频谱重构基函数中包括函数因变量；所述函数因变量的取值范围包括所述至少两个采样频率；
所述根据所述频谱重构基函数，对所述至少两个片段频谱序列进行重构，得到重构片段频谱序列，包括：
将所述至少两个采样频率输入所述频谱重构基函数中，得到所述频谱重构基函数对应的重构能量幅值；
根据所述重构能量幅值以及所述每个片段频谱序列中所包括的所述每个采样频率分别对应的能量幅值，对所述至少两个片段频谱序列进行重构，得到所述重构片段频谱序列。

6.根据权利要求4所述的方法，其特征在于，所述根据至少两个频谱表示基函数，生成初始拟合频谱函数，包括：
获取至少两个正态分布函数，将所述至少两个正态分布函数确定为所述至少两个频谱表示基函数；每个频谱表示基函数中均包括函数因变量；所述函数因变量的取值范围包括所述至少两个采样频率；
将所述至少两个采样频率分别输入所述每个频谱表示基函数中，得到所述每个频谱表示基函数分别对应的至少两个能量幅值表达式；每个频谱表示基函数均用于输出所述每个采样频率分别对应的能量幅值表达式；
将所述每个频谱表示基函数分别对应的至少两个能量幅值表达式中，输入有相同采样频率的能量幅值表达式进行加权求和，得到每个采样频率分别对应的求和能量幅值表达式；
根据所述每个采样频率分别对应的求和能量幅值表达式，生成所述初始拟合频谱函数。

7.根据权利要求6所述的方法，其特征在于，所述每个频谱表示基函数中均包括所对应的初始函数参数；
所述对所述至少两个频谱表示基函数进行调整，得到调整后的初始拟合频谱函数，包括：
获取收敛函数；所述收敛函数中包括所述初始拟合频谱函数和所述整体频谱序列；所述收敛函数用于表征所述初始拟合频谱函数与所述整体频谱序列之间的差异程度；
调整所述收敛函数中的所述初始拟合频谱函数中，所述每个频谱表示基函数分别对应的初始函数参数，得到所述调...

【专利技术属性】
技术研发人员：缪畅宇，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人