一种音频替换方法及终端技术

技术编号：32637985 阅读：13 留言：0更新日期：2022-03-12 18:13

本发明专利技术公开了一种音频替换方法及终端，包括步骤：获取第一有损音频与第一无损音频；基于DTW算法计算并得到第一有损音频与第一无损音频之间的线性回归函数；根据线性回归函数计算并得到损失函数值；根据损失函数值判断第一有损音频与第一无损音频的版本是否相同，若判断结果为版本相同，则根据线性回归函数进行第一有损音频与第一无损音频之间的替换。本发明专利技术由于无需人工进行匹配，能够有效地的降低匹配有损音频与无损音频的人工成本，提高匹配对齐的速度；同时，通过DTW算法，以降低两段音频序列在计算对应关系时因时间轴参差所带来的误差，从而提高音频匹配的精度，即提供了一种成本低、速度快且精度高的音频替换方法。速度快且精度高的音频替换方法。速度快且精度高的音频替换方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频替换方法及终端

[0001]本专利技术涉及音频处理
，特别涉及一种音频替换方法及终端。

技术介绍

[0002]在现有曲库的音频资源中，由于采集、传输、储存、压制等原因，现有曲库的音频资源均有不同程度的有损压缩，以减少文件大小，从而提高传输速度且节约存储空间。随着目前通信技术的发展，音响设备的升级，以及消费者对无损音频的需求日益增长，则需要将现有曲库中的有损音频升级为无损音频。
[0003]然而歌曲文件包括视频轨道和音频轨道，为了将有损音频轨道替换成无损音频轨道，需要保证歌曲文件的音画同步，并且与字幕文件匹配。由于有损音频与无损音频的来源不一定相同，存在两个问题：
[0004]1.有损音频与无损音频版本相同，但音频内容前后存在时间差，仅仅是时间轴上位移的不同；
[0005]2.有损音频与无损音频版本不同(比如演唱会版本与MV版本)，不同的语句速度不同，时间轴上的音频存在速度上的伸缩。
[0006]由此，传统的音频匹配方案需要人工浏览音频文件，判断版本是否一致，时间点是否同步。但人工匹配存在匹配时间较长，且时间点同步判断上具有一定的人为误差的问题。同时，不同音频的播放速度存在细微区别，人工很难发现，但是将音频与字幕和评分文件进行匹配时，却会有较大误差。

技术实现思路

[0007]本专利技术所要解决的技术问题是：提供一种音频替换方法及终端，通过自动匹配相同版本的有损音频和无损音频，以实现有损音频和无损音频的自动替换。
[0008]为了解决上述技术问题，本...

【技术保护点】

【技术特征摘要】
1.一种音频替换方法，其特征在于，包括步骤：获取第一有损音频与第一无损音频；基于DTW算法计算并得到所述第一有损音频与所述第一无损音频之间的线性回归函数；根据所述线性回归函数计算并得到损失函数值；根据所述损失函数值判断所述第一有损音频与所述第一无损音频的版本是否相同，若判断结果为版本相同，则根据所述线性回归函数进行所述第一有损音频与所述第一无损音频之间的替换。2.根据权利要求1所述的一种音频替换方法，其特征在于，所述根据所述线性回归函数计算并得到损失函数值具体包括以下步骤：将同一时间点上的所述第一有损音频与所述第一无损音频所形成的实际纵坐标值与根据所述线性回归函数所得到的理论纵坐标值之间的差值的平方进行累加，以得到损失函数值。3.根据权利要求1所述的一种音频替换方法，其特征在于，所述根据所述损失函数值判断所述第一有损音频与所述第一无损音频的版本是否相同具体包括以下步骤：判断所述损失函数值是否大于损失阈值，若是，则所述第一有损音频与所述第一无损音频的判断结果为版本不同，否则所述第一有损音频与所述第一无损音频的判断结果为版本相同。4.根据权利要求1所述的一种音频替换方法，其特征在于，所述根据所述线性回归函数进行所述第一有损音频与所述第一无损音频之间的替换具体包括以下步骤：将所述线性回归函数中的常数作为所述第一有损音频与所述第一无损音频在时间轴上的偏移时间；将矫正所述偏移时间之后的第一无损音频替换所述第一有损音频。5.根据权利要求4所述的一种音频替换方法，其特征在于，当所述第一无损音频的时间作为所述线性回归函数的纵坐标且所述第一有损音频的时间作为所述线性回归函数的横坐标时，所述第一无损音频的矫正具体包括以下步骤：若所述偏移时间大于0，则将所述第一无损音频补充时长为所述偏移时间的空白片段，若所述偏移时间等于0，则保持所述第一无损音频，若所述偏移时间小于0，则将所述第一无损音频的开头剪切掉时长为所述偏移时间的片段。6.根据权利要求1至5任一所述的一种音频...

【专利技术属性】
技术研发人员：林龙飞，徐继芸，
申请(专利权)人：福建星网视易信息系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人