音频数据的清洗方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:38870019 阅读:17 留言:0更新日期:2023-09-22 14:07
本申请公开了一种音频数据的清洗方法、装置、电子设备以及存储介质,涉及音频数据技术领域。该方法包括:获取待清洗音频数据,获取待清洗音频数据的音频信息,从多个音频处理算法中选择与音频信息对应的目标音频处理算法,以及基于目标音频处理算法对待清洗音频数据进行清洗处理,从待清洗音频数据中筛选出目标音频数据,从而可以根据音频数据的音频信息确定对音频数据进行处理的音频处理算法,实现自动对音频数据进行清洗,提高音频数据清洗的效率,并提高音频数据清洗的准确。并提高音频数据清洗的准确。并提高音频数据清洗的准确。

【技术实现步骤摘要】
音频数据的清洗方法、装置、电子设备以及存储介质


[0001]本申请涉及音频数据
,更具体地,涉及一种音频数据的清洗方法、装置、电子设备以及存储介质。

技术介绍

[0002]随着科学技术的发展,在网络电话、电话客服等领域的业务中音频数据是很重要的业务数据,并且声纹的识别的运用领域越来越广泛,大量合格的音频数据和正确的标签对于深度学习的训练来说尤为重要,可以大幅地提高神经网络模型的精度,因此需要对音频数据进行清洗。目前,音频数据庞大,依靠人工清洗数据,导致音频数据的清洗效率较低,并容易出现错误。

技术实现思路

[0003]鉴于上述问题,本申请提出了一种音频数据的清洗方法、装置、电子设备以及存储介质,以解决上述问题。
[0004]第一方面,本申请实施例提供了一种音频数据的清洗方法,所述方法包括:获取待清洗音频数据;获取所述待清洗音频数据的音频信息;从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法,以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理,从所述待清洗音频数据中筛选出目标音频数据,其中,所述目标音频数据用于进行模型训练。
[0005]第二方面,本申请实施例提供了一种音频数据的清洗装置,所述装置包括:待清洗音频数据获取模块,用于获取待清洗音频数据;音频信息获取模块,用于获取所述待清洗音频数据的音频信息;音频数据清洗模块,用于从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法,以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理,从所述待清洗音频数据中筛选出目标音频数据,其中,所述目标音频数据用于进行模型训练。
[0006]第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行上述方法。
[0007]第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法。
[0008]本申请实施例提供的音频数据的清洗方法、装置、电子设备以及存储介质,获取待清洗音频数据,获取待清洗音频数据的音频信息,从多个音频处理算法中选择与音频信息对应的目标音频处理算法,以及基于目标音频处理算法对待清洗音频数据进行清洗处理,从待清洗音频数据中筛选出目标音频数据,从而可以根据音频数据的音频信息确定对音频数据进行处理的音频处理算法,实现自动对音频数据进行清洗,提高音频数据清洗的效率,并提高音频数据清洗的准确率。
附图说明
[0009]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0010]图1示出了本申请实施例提供的音频数据的清洗方法的流程示意图;
[0011]图2示出了本申请一个实施例提供的音频数据的清洗方法的流程示意图;
[0012]图3示出了本申请的图2所示的音频数据的清洗方法的步骤S250的流程示意图;
[0013]图4示出了本申请一个实施例提供的适用于音频数据的清洗方法的第一音频处理算法流程示意图;
[0014]图5示出了本申请一个实施例提供的音频数据的清洗方法的流程示意图;
[0015]图6示出了本申请一个实施例提供的适用于音频数据的清洗方法的第三音频处理算法流程示意图;
[0016]图7示出了本申请一个实施例提供的音频数据的清洗方法的流程示意图;
[0017]图8示出了本申请一个实施例提供的适用于音频数据的清洗方法的第四音频处理算法流程示意图;
[0018]图9示出了本申请一个实施例提供的音频数据的清洗方法的流程示意图;
[0019]图10示出了本申请一个实施例提供的适用于音频数据的清洗方法的格式转换模块流程示意图;
[0020]图11示出了本申请一个实施例提供的适用于音频数据的清洗方法的质量检测模块流程示意图;
[0021]图12示出了本申请一个实施例提供的音频数据的清洗方法的流程示意图;
[0022]图13示出了本申请实施例提供的音频数据的清洗装置的模块框图;
[0023]图14示出了本申请实施例用于执行根据本申请实施例的音频数据的清洗方法的电子设备的框图;
[0024]图15示出了本申请实施例的用于保存或者携带实现根据本申请实施例的音频数据的清洗方法的程序代码的存储单元。
具体实施方式
[0025]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
[0026]目前,根据深度神经网络的机器学习方法已经成为了声纹识别的主流方法,因此,大量合格的音频数据和正确的音频数据标签对于深度学习的训练来说尤为重要,可以大幅地提高神经网络模型的精度,从而大幅提高声纹识别的准确性和鲁棒性。现存的大量音频数据,不确定是否合格并且不具备正确的标签的占绝大多数,如果将音频数据正确地挑选和标注出来,对于声纹识别的发展会有巨大的帮助。但是,由于音频数据数量较大,依靠人工去清洗是不现实的,并且效率较低。
[0027]针对上述问题,专利技术人经过长期的研究发现,并提出了本申请实施例提供的音频数据的清洗方法、装置、服务器以及存储介质,可以根据音频数据的音频信息确定对音频数
据进行处理的音频处理算法,实现自动对音频数据进行清洗,提高音频数据清洗的效率,并提高音频数据清洗的准确率。其中,具体的音频数据的清洗方法在后续的实施例中进行详细的说明。
[0028]请参阅图1,图1示出了本申请实施例提供的音频数据的清洗方法的流程示意图。在具体的实施例中,所述音频数据的清洗方法应用于如图13所示的音频数据的清洗装置200以及配置有音频数据的清洗装置200的电子设备100(图14)。下面将以电子设备为例,说明本实施例的具体流程。下面将针对图1所示的流程进行详细的阐述,所述音频数据的清洗方法具体可以包括以下步骤:
[0029]步骤S110:获取待清洗音频数据。
[0030]在本实施例中,电子设备可以获取待清洗音频数据。需要说明的是,待清洗音频数据可以是未经过格式转换和质量检测的音频数据,待清洗音频数据也可以是经过格式转换和质量检测的音频数据,在此不做限定。
[0031]在一些实施方式中,在客服进行工作时,可以获取客服与客户通话的待清洗音频数据。作为一种方式,在接通电话时,就开始获取客服与客户通话的待清洗音频数据。作为另一种方式,在客服与客户通话过程中,客服可以控制电子设备获取通话中的待清洗音频数据。
[0032]在一些实施方式中,用户可以对获取待清洗音频数据的获取时间进行设置,电子设备就可以在设定的时间获取待清洗音频数据。例如,待清洗音频数据1的获取时间为10秒后,则电子设备在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频数据的清洗方法,其特征在于,所述方法包括:获取待清洗音频数据;获取所述待清洗音频数据的音频信息;从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法,以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理,从所述待清洗音频数据中筛选出目标音频数据,其中,所述目标音频数据用于进行模型训练。2.根据权利要求1所述的方法,其特征在于,所述从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法,以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理,从所述待清洗音频数据中筛选出目标音频数据,包括:对所述音频信息对应的发言人数量进行检测;当检测到所述音频信息对应的发言人数量为多个时,对所述音频信息对应的声道进行检测,获得声道检测结果;基于所述声道检测结果,从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法,以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理,从所述待清洗音频数据中筛选出目标音频数据。3.根据权利要求2所述的方法,其特征在于,所述基于所述声道检测结果,从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法,以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理,从所述待清洗音频数据中筛选出目标音频数据,包括:当所述声道检测结果表征所述待清洗音频数据为混合声道音频数据时,从多个音频处理算法中选择第一音频处理算法作为目标音频处理算法,以及基于所述第一音频处理算法对所述待清洗音频数据进行人声分离处理,获得多条单发言人的音频数据,作为所述目标音频数据;或者当所述声道检测结果表征所述待清洗音频数据为单声道音频数据时,从多个音频处理算法中选择第二音频处理算法作为目标音频处理算法,以及基于所述第二音频处理算法对所述待清洗音频数据进行声道分离处理,获得多条单发言人的音频数据,作为所述目标音频数据。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:当检测到所述音频信息对应的发言人数量为多个时,对所述待清洗音频数据对应的发言人的角色区分度进行检测;当检测到所述待清洗音频数据对应的发言人的角色区分度大于区分度阈值时,从所述多个音频处理算法中选择第三音频处理算法作为目标音频处理算法,以及基于所述第三音频处理算法对所述待清洗音频进行角色区分,从所述待清洗音频数据中筛选出对应目标角色的待清洗音频数据,作为目标音频数据。5.根据权利要求1

4任一项所述的方法,其特征在于,所述从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法,以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理,从所述待清洗音频数据中筛选出目标音频数据,包括:从多个音频处理算法中...

【专利技术属性】
技术研发人员:黄润乾陈东鹏
申请(专利权)人:深圳市声扬科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1