【技术实现步骤摘要】
一种音频数据的对齐方法、装置、设备和存储介质
本申请涉及音频处理
,尤其涉及一种音频数据的对齐方法、装置、设备和存储介质。
技术介绍
随着互联网时代的发展,线上KTV变得流行。许多声音类的APP都有K歌场景,该场景流程为:用户选中一首歌的伴奏,播放伴奏,然后跟随伴奏唱歌,结束后人声与伴奏混音回放,保存歌曲进行发布分享。与线下的K歌场景不同,线上K歌场景对声音的处理要复杂很多,若处理不当,人声与伴奏的混音中会出现人声与伴奏不同步。用户跟随外放的伴奏唱歌,在用户踩准节奏的情况下,由于手机系统在播放和录音时要经过D/A或A/D转换等处理,采集到的人声相对伴奏有延时。如果直接进行混音,人耳会有不同程度的感知,如果延时在30ms以内,人耳不易察觉,如果延时变大,达到50ms甚至更大,人耳能很明显地感觉到人声和伴奏不同步,这样会降低用户的声音体验。现有混音时的人声和伴奏对齐,主要通过用户手动调节对齐的方式,对齐效果并不理想,且由用户调节的方式会影响用户体验。因此,提供一种有效对齐人声和伴奏的方法是本领域技术人员亟待
【技术保护点】
1.一种音频数据的对齐方法,其特征在于,包括步骤:/nS1、获取待对齐的原始录音数据和原始伴奏数据;/nS2、通过相似性检测公式,对所述原始录音数据和所述原始伴奏数据进行相似性检测,得到所述原始录音数据的延时采样点数,其中,所述相似性检测公式为:/n
【技术特征摘要】
1.一种音频数据的对齐方法,其特征在于,包括步骤:
S1、获取待对齐的原始录音数据和原始伴奏数据;
S2、通过相似性检测公式,对所述原始录音数据和所述原始伴奏数据进行相似性检测,得到所述原始录音数据的延时采样点数,其中,所述相似性检测公式为:
式中,Xcorrmax对应的位置即延时采样点数,Xcorr(i)为第i个波形点位置对应的相似度值,n为用于做相似性检测的波形点的音频波形点数量,xj为用于做相似性检测的原始录音数据的第j个波形点,yj-i为用于做相似性检测的原始伴奏数据的第j-i个波形点,x为原始录音数据,y为原始伴奏数据,i和j分别为波形点位置;
S3、将所述原始伴奏数据的频率和所述原始录音数据的频率调整一致;
S4、从所述原始录音数据中删除所述延时采样点数,以实现所述原始录音数据和所述原始伴奏数据的对齐。
2.根据权利要求1所述的音频数据的对齐方法,其特征在于,步骤S3具体包括:
将所述原始伴奏数据的频率调整至所述原始录音数据的频率。
3.根据权利要求2所述的音频数据的对齐方法,其特征在于,步骤S2之前还包括:
将所述原始录音数据和所述原始伴奏数据降频至第一预置频率,并根据降频后的所述原始录音数据和所述原始伴奏数据执行后续步骤;
步骤S2之后还包括:
将所述延时采样点数升频至所述原始伴奏数据的频率,得到新延时采样点数,并通过所述新延时采样点数执行后续步骤。
4.根据权利要求3所述的音频数据的对齐方法,其特征在于,将所述原始录音数据和所述原始伴奏数据降频至第一预置频率,并根据降频后的所述原始录音数据和所述原始伴奏数据执行后续步骤之前还包括:
将所述原始录音数据中歌词起点前预置长度的音频数据截取,得到第一截取音频数据,所述第一截取音频数据用于相似性检测;
将所述原始伴奏数据中歌词起点前所述预置长度的音频数据截取,得到第二截取音频数据,所述第二截取音频数据用于相似性检测。
5.根据权利要求1所述的音频数据的...
【专利技术属性】
技术研发人员:熊佳,周年斌,
申请(专利权)人:广州趣丸网络科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。