音源数据修复方法、装置、终端及存储介质制造方法及图纸

技术编号：29493976 阅读：14 留言：0更新日期：2021-07-30 19:06

本申请关于一种音源数据修复方法、装置、终端及存储介质，涉及音频数据处理技术领域。所述方法包括：获取目标音源数据；所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据；将所述目标音源数据与修复临界值进行比较，获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据；所述修复临界值是基于合成音源数据样本得到的振幅值；基于所述修复临界值，对所述目标修复数据进行处理，获得修复后的所述目标音源数据。通过上述方法，将合成音源数据作为目标音源数据，对其中振幅过高或者过低的部分进行修正，从而抑制其中破音或者音质破损的部分，提高了合成音源数据的音质。

全部详细技术资料下载

【技术实现步骤摘要】
音源数据修复方法、装置、终端及存储介质
本申请涉及音频数据处理
，特别涉及音源数据修复方法、装置、终端及存储介质。
技术介绍
目前，随着用户对音频数据处理的需求的提高，出现去除音频文件中指定类型的声音的功能。在相关技术中，音频处理设备可以将音频数据通过音频分割再合成的过程，去除掉音频文件中指定类型的声音，获得去除指定类型声音后的新的音频文件。然而，在上述方法中，对音频数据进行分割再合成的处理后，可能会出现合成后的新的音频文件中的音源数据对应的波峰值与波谷值的差距过大的情况，从而导致经过指定类型声音去除功能后生成的音源数据音质较差。
技术实现思路
本申请实施例提供了一种音源数据修复方法、装置、终端及存储介质，可以提高去除指定类型的声音之后的合成音源数据的质量，该技术方案如下：一方面，提供了一种音源数据修复方法，所述方法包括：获取目标音源数据；所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据；将所述目标音源数据与修复临界值进行比较，获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据；所述修复临界值是基于合成音源数据样本得到的振幅值；基于所述修复临界值，对所述目标修复数据进行处理，获得修复后的所述目标音源数据。在一种可能的实现方式中，所述将所述目标音源数据与修复临界值进行比较，获取超过所述修复临界值的部分数据作为目标修复数据，包括：基于所述目标音源数据的波形图，获得所述目标音源数据的幅度极值；...

【技术保护点】
1.一种音源数据修复方法，其特征在于，所述方法包括：/n获取目标音源数据；所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据；/n将所述目标音源数据与修复临界值进行比较，获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据；所述修复临界值是基于合成音源数据样本得到的振幅值；/n基于所述修复临界值，对所述目标修复数据进行处理，获得修复后的所述目标音源数据。/n

【技术特征摘要】
1.一种音源数据修复方法，其特征在于，所述方法包括：
获取目标音源数据；所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据；
将所述目标音源数据与修复临界值进行比较，获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据；所述修复临界值是基于合成音源数据样本得到的振幅值；
基于所述修复临界值，对所述目标修复数据进行处理，获得修复后的所述目标音源数据。

2.根据权利要求1所述的方法，其特征在于，所述将所述目标音源数据与修复临界值进行比较，获取超过所述修复临界值的部分数据作为目标修复数据，包括：
基于所述目标音源数据的波形图，获得所述目标音源数据的幅度极值；所述幅度极值包括至少一个波峰值以及至少一个波谷值；
将绝对值超过所述修复临界值的所述幅度极值确定为所述目标修复数据；
所述基于所述修复临界值，对所述目标修复数据进行处理，获得修复后的所述目标音源数据，包括：
基于所述修复临界值，对所述目标修复数据进行处理，获得处理后的目标音源数据；
基于所述处理后的目标音源数据的波形图，获取所述处理后的目标音源数据的所述幅度极值；
响应于至少一个所述幅度极值超过所述修复临界值，将超过所述修复临界值的所述幅度极值确定为新的所述目标修复数据；
响应于所述幅度极值未超过所述修复临界值，将所述处理后的所述目标音源数据确定为修复后的所述目标音源数据。

3.根据权利要求1所述的方法，其特征在于，所述获取目标音源数据，包括：
按照指定时长对所述原始音源数据进行切分，获得多个原始音源数据段；
去除所述多个原始音源数据段的所述指定类型声音，将去除所述指定类型声音的所述多个原始音源数据段进行合成获得所述目标音源数据。

4.根据权利要求1所述的方法，其特征在于，所述将所述目标音源数据与修复临界值进行比较，获取超过所述修复临界值的部分数据作为目标修复数据之前，还包括：
获取合成音源数据集合；所述合成音源数据集合中包括至少一个合成音源数据样本；
将至少一个所述合成音源数据样本依次输入特征提取网络，由所述特征提取网络输出所述合成音源数据样本对应的特征矩阵；所述特征提取网络是用于基于所述合成音源数据样本对应的频谱图，生成所述特征矩阵的卷积神经网络；所述特征矩阵用于指示所述频谱图中两个通道分别对应的实值与虚值之间的距离特征；
基于至少一个所述合成音源数据样本对应的所述特征矩阵，获得至少一个所述合成音源数据样本对应的幅值矩阵；所述幅值矩阵用于指示所述合成音源数据样本在进行高频抑制处理后的各个采样点上对应的幅值；
基于至少一个所述合成音源数据样本对应的所述幅值矩阵，获取至少一个所述合成音源数据样本对应的幅值极值；所述幅值极值包括幅值最大值以及幅值最小值中的至少一个；
基于至少一个所述合成音源数据样本对应的所述幅值极值，确定所述修复临界值。

5.根据权利要求4所述的方法，其特征在于，所述将至少一个所述合成音源数据样本依次输入特征提取网络，由所述特征提取网...

【专利技术属性】
技术研发人员：曹伟鹏，
申请(专利权)人：广州繁星互娱信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人