音源数据修复方法、装置、终端及存储介质制造方法及图纸

技术编号:29493976 阅读:14 留言:0更新日期:2021-07-30 19:06
本申请关于一种音源数据修复方法、装置、终端及存储介质,涉及音频数据处理技术领域。所述方法包括:获取目标音源数据;所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据;将所述目标音源数据与修复临界值进行比较,获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据;所述修复临界值是基于合成音源数据样本得到的振幅值;基于所述修复临界值,对所述目标修复数据进行处理,获得修复后的所述目标音源数据。通过上述方法,将合成音源数据作为目标音源数据,对其中振幅过高或者过低的部分进行修正,从而抑制其中破音或者音质破损的部分,提高了合成音源数据的音质。

【技术实现步骤摘要】
音源数据修复方法、装置、终端及存储介质
本申请涉及音频数据处理
,特别涉及音源数据修复方法、装置、终端及存储介质。
技术介绍
目前,随着用户对音频数据处理的需求的提高,出现去除音频文件中指定类型的声音的功能。在相关技术中,音频处理设备可以将音频数据通过音频分割再合成的过程,去除掉音频文件中指定类型的声音,获得去除指定类型声音后的新的音频文件。然而,在上述方法中,对音频数据进行分割再合成的处理后,可能会出现合成后的新的音频文件中的音源数据对应的波峰值与波谷值的差距过大的情况,从而导致经过指定类型声音去除功能后生成的音源数据音质较差。
技术实现思路
本申请实施例提供了一种音源数据修复方法、装置、终端及存储介质,可以提高去除指定类型的声音之后的合成音源数据的质量,该技术方案如下:一方面,提供了一种音源数据修复方法,所述方法包括:获取目标音源数据;所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据;将所述目标音源数据与修复临界值进行比较,获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据;所述修复临界值是基于合成音源数据样本得到的振幅值;基于所述修复临界值,对所述目标修复数据进行处理,获得修复后的所述目标音源数据。在一种可能的实现方式中,所述将所述目标音源数据与修复临界值进行比较,获取超过所述修复临界值的部分数据作为目标修复数据,包括:基于所述目标音源数据的波形图,获得所述目标音源数据的幅度极值;所述幅度极值包括至少一个波峰值以及至少一个波谷值;将绝对值超过所述修复临界值的所述幅度极值确定为所述目标修复数据;所述基于所述修复临界值,对所述目标修复数据进行处理,获得修复后的所述目标音源数据,包括:基于所述修复临界值,对所述目标修复数据进行处理,获得处理后的目标音源数据;基于所述处理后的目标音源数据的波形图,获取所述处理后的目标音源数据的所述幅度极值;响应于至少一个所述幅度极值超过所述修复临界值,将超过所述修复临界值的所述幅度极值确定为新的所述目标修复数据;响应于所述幅度极值未超过所述修复临界值,将所述处理后的所述目标音源数据确定为修复后的所述目标音源数据。在一种可能的实现方式中,所述获取目标音源数据,包括:按照指定时长对所述原始音源数据进行切分,获得多个原始音源数据段;去除所述多个原始音源数据段的所述指定类型声音,将去除所述指定类型声音的所述多个原始音源数据段进行合成获得所述目标音源数据。在一种可能的实现方式中,所述将所述目标音源数据与修复临界值进行比较,获取超过所述修复临界值的部分数据作为目标修复数据之前,还包括:获取合成音源数据集合;所述合成音源数据集合中包括至少一个合成音源数据样本;将至少一个所述合成音源数据样本依次输入特征提取网络,由所述特征提取网络输出所述合成音源数据样本对应的特征矩阵;所述特征提取网络是用于基于所述合成音源数据样本对应的频谱图,生成所述特征矩阵的卷积神经网络;所述特征矩阵用于指示所述频谱图中两个通道分别对应的实值与虚值之间的距离特征;基于至少一个所述合成音源数据样本对应的所述特征矩阵,获得至少一个所述合成音源数据样本对应的幅值矩阵;所述幅值矩阵用于指示所述合成音源数据样本在进行高频抑制处理后的各个采样点上对应的幅值;基于至少一个所述合成音源数据样本对应的所述幅值矩阵,获取至少一个所述合成音源数据样本对应的幅值极值;所述幅值极值包括幅值最大值以及幅值最小值中的至少一个;基于至少一个所述合成音源数据样本对应的所述幅值极值,确定所述修复临界值。在一种可能的实现方式中,所述将至少一个所述合成音源数据样本依次输入特征提取网络,由所述特征提取网络输出所述合成音源数据样本对应的特征矩阵,包括:将所述合成音源数据样本转化为原始幅值矩阵;所述原始幅值矩阵用于指示所述合成音源数据样本的各个采样点上的音频幅值;通过短时傅里叶变换公式,将所述原始幅值矩阵转换为频谱图矩阵;通过矩阵裁剪,去除所述频谱图矩阵中频率数值大于第一临界值的部分,生成低频频谱图矩阵;所述低频频谱图矩阵用于指示频率小于第一临界值的各个采样点对应的音频能量;基于平方差公式对所述低频频谱图矩阵进行计算,确定所述合成音源数据样本对应的低频频谱图距离矩阵;将所述低频频谱图距离矩阵输入所述特征提取网络,由所述特征提取网络输出所述特征矩阵。在一种可能的实现方式中,所述基于至少一个所述合成音源数据样本对应的所述特征矩阵,获得至少一个所述合成音源数据样本对应的幅值矩阵,包括:将所述合成音源数据样本对应的所述特征矩阵,与所述低频频谱图矩阵进行点积操作,生成目标特征矩阵;所述目标特征矩阵是叠加有所述距离特征的低频频谱图矩阵;将所述目标特征矩阵的指定维度下对应的高频部分进行填充补零处理,所述指定维度为用于指示所述频谱图频率的维度;将进行填充补零处理后的所述目标特征矩阵通过反傅里叶变换公式进行计算,获得所述合成音源数据样本对应的所述幅值矩阵。在一种可能的实现方式中,所述基于至少一个所述合成音源数据样本对应的所述幅值极值,确定所述修复临界值,包括:对至少一个所述合成音源数据样本对应的所述幅值极值的绝对值取平均,获得所述修复临界值。在一种可能的实现方式中,所述基于所述修复临界值,对所述目标修复数据进行处理,获得修复后的所述目标音源数据,包括:将所述目标修复数据,替换为所述目标修复数据与所述修复临界值的比值,获得修复后的所述目标音源数据。另一方面,提供了一种音源数据修复装置,所述装置包括:数据获取模块,用于获取目标音源数据;所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据;目标获取模块,用于将所述目标音源数据与修复临界值进行比较,获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据;所述修复临界值是基于合成音源数据样本得到的振幅值;目标修复模块,用于基于所述修复临界值,对所述目标修复数据进行处理,获得修复后的所述目标音源数据。在一种可能的实现方式中,所述目标获取模块,包括:第一极值获取子模块,用于基于所述目标音源数据的波形图,获得所述目标音源数据的幅度极值;所述幅度极值包括至少一个波峰值以及至少一个波谷值;目标确定子模块,用于将绝对值超过所述修复临界值的所述幅度极值确定为所述目标修复数据;所述目标修复模块,包括:目标处理子模块,用于基于所述修复临界值,对所述目标修复数据进行处理,获得处理后的目标音源数据;第二极值获取子模块,用于基于所述处理后的目标音源数据的波形图,获取所述处理后的目标音源数据的所述幅度极值;继续处理子模块,用于响应于至少一个所述幅度极值超过所述修复临界值,将超过所述修复临界值的所述幅度极值确定为新的所述目标修复数据;本文档来自技高网...

【技术保护点】
1.一种音源数据修复方法,其特征在于,所述方法包括:/n获取目标音源数据;所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据;/n将所述目标音源数据与修复临界值进行比较,获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据;所述修复临界值是基于合成音源数据样本得到的振幅值;/n基于所述修复临界值,对所述目标修复数据进行处理,获得修复后的所述目标音源数据。/n

【技术特征摘要】
1.一种音源数据修复方法,其特征在于,所述方法包括:
获取目标音源数据;所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据;
将所述目标音源数据与修复临界值进行比较,获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据;所述修复临界值是基于合成音源数据样本得到的振幅值;
基于所述修复临界值,对所述目标修复数据进行处理,获得修复后的所述目标音源数据。


2.根据权利要求1所述的方法,其特征在于,所述将所述目标音源数据与修复临界值进行比较,获取超过所述修复临界值的部分数据作为目标修复数据,包括:
基于所述目标音源数据的波形图,获得所述目标音源数据的幅度极值;所述幅度极值包括至少一个波峰值以及至少一个波谷值;
将绝对值超过所述修复临界值的所述幅度极值确定为所述目标修复数据;
所述基于所述修复临界值,对所述目标修复数据进行处理,获得修复后的所述目标音源数据,包括:
基于所述修复临界值,对所述目标修复数据进行处理,获得处理后的目标音源数据;
基于所述处理后的目标音源数据的波形图,获取所述处理后的目标音源数据的所述幅度极值;
响应于至少一个所述幅度极值超过所述修复临界值,将超过所述修复临界值的所述幅度极值确定为新的所述目标修复数据;
响应于所述幅度极值未超过所述修复临界值,将所述处理后的所述目标音源数据确定为修复后的所述目标音源数据。


3.根据权利要求1所述的方法,其特征在于,所述获取目标音源数据,包括:
按照指定时长对所述原始音源数据进行切分,获得多个原始音源数据段;
去除所述多个原始音源数据段的所述指定类型声音,将去除所述指定类型声音的所述多个原始音源数据段进行合成获得所述目标音源数据。


4.根据权利要求1所述的方法,其特征在于,所述将所述目标音源数据与修复临界值进行比较,获取超过所述修复临界值的部分数据作为目标修复数据之前,还包括:
获取合成音源数据集合;所述合成音源数据集合中包括至少一个合成音源数据样本;
将至少一个所述合成音源数据样本依次输入特征提取网络,由所述特征提取网络输出所述合成音源数据样本对应的特征矩阵;所述特征提取网络是用于基于所述合成音源数据样本对应的频谱图,生成所述特征矩阵的卷积神经网络;所述特征矩阵用于指示所述频谱图中两个通道分别对应的实值与虚值之间的距离特征;
基于至少一个所述合成音源数据样本对应的所述特征矩阵,获得至少一个所述合成音源数据样本对应的幅值矩阵;所述幅值矩阵用于指示所述合成音源数据样本在进行高频抑制处理后的各个采样点上对应的幅值;
基于至少一个所述合成音源数据样本对应的所述幅值矩阵,获取至少一个所述合成音源数据样本对应的幅值极值;所述幅值极值包括幅值最大值以及幅值最小值中的至少一个;
基于至少一个所述合成音源数据样本对应的所述幅值极值,确定所述修复临界值。


5.根据权利要求4所述的方法,其特征在于,所述将至少一个所述合成音源数据样本依次输入特征提取网络,由所述特征提取网...

【专利技术属性】
技术研发人员:曹伟鹏
申请(专利权)人:广州繁星互娱信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1