一种音频替换方法及终端技术

技术编号:32637985 阅读:13 留言:0更新日期:2022-03-12 18:13
本发明专利技术公开了一种音频替换方法及终端,包括步骤:获取第一有损音频与第一无损音频;基于DTW算法计算并得到第一有损音频与第一无损音频之间的线性回归函数;根据线性回归函数计算并得到损失函数值;根据损失函数值判断第一有损音频与第一无损音频的版本是否相同,若判断结果为版本相同,则根据线性回归函数进行第一有损音频与第一无损音频之间的替换。本发明专利技术由于无需人工进行匹配,能够有效地的降低匹配有损音频与无损音频的人工成本,提高匹配对齐的速度;同时,通过DTW算法,以降低两段音频序列在计算对应关系时因时间轴参差所带来的误差,从而提高音频匹配的精度,即提供了一种成本低、速度快且精度高的音频替换方法。速度快且精度高的音频替换方法。速度快且精度高的音频替换方法。

【技术实现步骤摘要】
一种音频替换方法及终端


[0001]本专利技术涉及音频处理
,特别涉及一种音频替换方法及终端。

技术介绍

[0002]在现有曲库的音频资源中,由于采集、传输、储存、压制等原因,现有曲库的音频资源均有不同程度的有损压缩,以减少文件大小,从而提高传输速度且节约存储空间。随着目前通信技术的发展,音响设备的升级,以及消费者对无损音频的需求日益增长,则需要将现有曲库中的有损音频升级为无损音频。
[0003]然而歌曲文件包括视频轨道和音频轨道,为了将有损音频轨道替换成无损音频轨道,需要保证歌曲文件的音画同步,并且与字幕文件匹配。由于有损音频与无损音频的来源不一定相同,存在两个问题:
[0004]1.有损音频与无损音频版本相同,但音频内容前后存在时间差,仅仅是时间轴上位移的不同;
[0005]2.有损音频与无损音频版本不同(比如演唱会版本与MV版本),不同的语句速度不同,时间轴上的音频存在速度上的伸缩。
[0006]由此,传统的音频匹配方案需要人工浏览音频文件,判断版本是否一致,时间点是否同步。但人工匹配存在匹配时间较长,且时间点同步判断上具有一定的人为误差的问题。同时,不同音频的播放速度存在细微区别,人工很难发现,但是将音频与字幕和评分文件进行匹配时,却会有较大误差。

技术实现思路

[0007]本专利技术所要解决的技术问题是:提供一种音频替换方法及终端,通过自动匹配相同版本的有损音频和无损音频,以实现有损音频和无损音频的自动替换。
[0008]为了解决上述技术问题,本专利技术采用的技术方案为:
[0009]一种音频替换方法,包括步骤:
[0010]获取第一有损音频与第一无损音频;
[0011]基于DTW算法计算并得到所述第一有损音频与所述第一无损音频之间的线性回归函数;
[0012]根据所述线性回归函数计算并得到损失函数值;
[0013]根据所述损失函数值判断所述第一有损音频与所述第一无损音频的版本是否相同,若判断结果为版本相同,则根据所述线性回归函数进行所述第一有损音频与所述第一无损音频之间的替换。
[0014]为了解决上述技术问题,本专利技术采用的另一种技术方案为:
[0015]一种音频替换终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种音频替换方法中的各个步骤。
[0016]本专利技术的有益效果在于:一种音频替换方法及终端,通过DTW算法计算并得到有损音频与无损音频之间的线性回归函数,根据线性回归函数计算并得到损失函数值,基于损失函数值判断有损音频与无损音频的版本是否相同,并在判断结果为版本相同时,根据线性回归函数进行第一有损音频与第一无损音频之间的替换,以实现有损音频和无损音频的自动替换。由此,由于无需人工进行匹配,能够有效地的降低匹配有损音频与无损音频的人工成本,提高匹配对齐的速度;同时,通过DTW算法,以降低两段音频序列在计算对应关系时因时间轴参差所带来误差,从而提高音频匹配的精度,即提供了一种成本低、速度快且精度高的音频替换方法。
附图说明
[0017]图1为本专利技术实施例的一种音频替换方法的流程示意图;
[0018]图2为本专利技术实施例涉及的有损音频和无损音频的一种时间轴对比连线图;
[0019]图3为图2中的有损音频和无损音频的相似路径序列图;
[0020]图4为本专利技术实施例涉及的有损音频和无损音频的另一种时间轴对比连线图;
[0021]图5为图4中的有损音频和无损音频的相似路径序列图;
[0022]图6为本专利技术实施例的一种音频替换终端的结构示意图。
[0023]标号说明:
[0024]1、一种音频替换终端;2、处理器;3、存储器。
具体实施方式
[0025]为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。
[0026]请参照图1至图5,一种音频替换方法,包括步骤:
[0027]获取第一有损音频与第一无损音频;
[0028]基于DTW算法计算并得到所述第一有损音频与所述第一无损音频之间的线性回归函数;
[0029]根据所述线性回归函数计算并得到损失函数值;
[0030]根据所述损失函数值判断所述第一有损音频与所述第一无损音频的版本是否相同,若判断结果为版本相同,则根据所述线性回归函数进行所述第一有损音频与所述第一无损音频之间的替换。
[0031]从上述描述可知,本专利技术的有益效果在于:通过DTW算法计算并得到有损音频与无损音频之间的线性回归函数,根据线性回归函数计算并得到损失函数值,基于损失函数值判断有损音频与无损音频的版本是否相同,并在判断结果为版本相同时,根据线性回归函数进行第一有损音频与第一无损音频之间的替换,以实现有损音频和无损音频的自动替换。由此,由于无需人工进行匹配,能够有效地的降低匹配有损音频与无损音频的人工成本,提高匹配对齐的速度;同时,通过DTW算法,以降低两段音频序列在计算对应关系时因时间轴参差所带来的误差,从而提高音频匹配的精度,即提供了一种成本低、速度快且精度高的音频替换方法。
[0032]进一步地,所述根据所述线性回归函数计算并得到损失函数值具体包括以下步
骤:
[0033]将同一时间点上的所述第一有损音频与所述第一无损音频所形成的实际纵坐标值与根据所述线性回归函数所得到的理论纵坐标值之间的差值的平方进行累加,以得到损失函数值。
[0034]从上述描述可知,通过有损音频与无损音频的实际纵坐标值与根据线性回归函数所得到的理论纵坐标值之间的差值的平方来得到损失函数值,从而基于所得到的损失函数值以同时判断出有损音频与无损音频的版本是否相同且在速度上是否存在伸缩差距,以便于后续的音频矫正。
[0035]进一步地,所述根据所述损失函数值判断所述第一有损音频与所述第一无损音频的版本是否相同具体包括以下步骤:
[0036]判断所述损失函数值是否大于损失阈值,若是,则所述第一有损音频与所述第一无损音频的判断结果为版本不同,否则所述第一有损音频与所述第一无损音频的判断结果为版本相同。
[0037]从上述描述可知,若损失函数值小于损失阈值,则说明两个音频之间呈一定的线性关系,因此判定有损音频与无损音频的版本相同,仅仅是存在时间轴上的偏移;而如果损失函数值大于损失阈值,则说明有损音频与无损音频不仅在时间轴上存在偏移,同时在速度上存在伸缩差距,因此两个音频的版本并不相同。由此,通过设置损失阈值,以有效快速的判断出两个音频的版本是否相同。
[0038]进一步地,所述根据所述线性回归函数进行所述第一有损音频与所述第一无损音频之间的替换具体包括以下步骤:
[0039]将所述线性回归函数中的常数作为所述第一有损音频与所述第一无损音频在时间轴上的偏移时间;
[0040]将矫正所述偏移时间之后的第一无损音频替换所述第一有损音频。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频替换方法,其特征在于,包括步骤:获取第一有损音频与第一无损音频;基于DTW算法计算并得到所述第一有损音频与所述第一无损音频之间的线性回归函数;根据所述线性回归函数计算并得到损失函数值;根据所述损失函数值判断所述第一有损音频与所述第一无损音频的版本是否相同,若判断结果为版本相同,则根据所述线性回归函数进行所述第一有损音频与所述第一无损音频之间的替换。2.根据权利要求1所述的一种音频替换方法,其特征在于,所述根据所述线性回归函数计算并得到损失函数值具体包括以下步骤:将同一时间点上的所述第一有损音频与所述第一无损音频所形成的实际纵坐标值与根据所述线性回归函数所得到的理论纵坐标值之间的差值的平方进行累加,以得到损失函数值。3.根据权利要求1所述的一种音频替换方法,其特征在于,所述根据所述损失函数值判断所述第一有损音频与所述第一无损音频的版本是否相同具体包括以下步骤:判断所述损失函数值是否大于损失阈值,若是,则所述第一有损音频与所述第一无损音频的判断结果为版本不同,否则所述第一有损音频与所述第一无损音频的判断结果为版本相同。4.根据权利要求1所述的一种音频替换方法,其特征在于,所述根据所述线性回归函数进行所述第一有损音频与所述第一无损音频之间的替换具体包括以下步骤:将所述线性回归函数中的常数作为所述第一有损音频与所述第一无损音频在时间轴上的偏移时间;将矫正所述偏移时间之后的第一无损音频替换所述第一有损音频。5.根据权利要求4所述的一种音频替换方法,其特征在于,当所述第一无损音频的时间作为所述线性回归函数的纵坐标且所述第一有损音频的时间作为所述线性回归函数的横坐标时,所述第一无损音频的矫正具体包括以下步骤:若所述偏移时间大于0,则将所述第一无损音频补充时长为所述偏移时间的空白片段,若所述偏移时间等于0,则保持所述第一无损音频,若所述偏移时间小于0,则将所述第一无损音频的开头剪切掉时长为所述偏移时间的片段。6.根据权利要求1至5任一所述的一种音频...

【专利技术属性】
技术研发人员:林龙飞徐继芸
申请(专利权)人:福建星网视易信息系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1