音频数据的清洗方法、装置、电子设备以及存储介质制造方法及图纸

技术编号：38870019 阅读：17 留言：0更新日期：2023-09-22 14:07

本申请公开了一种音频数据的清洗方法、装置、电子设备以及存储介质，涉及音频数据技术领域。该方法包括：获取待清洗音频数据，获取待清洗音频数据的音频信息，从多个音频处理算法中选择与音频信息对应的目标音频处理算法，以及基于目标音频处理算法对待清洗音频数据进行清洗处理，从待清洗音频数据中筛选出目标音频数据，从而可以根据音频数据的音频信息确定对音频数据进行处理的音频处理算法，实现自动对音频数据进行清洗，提高音频数据清洗的效率，并提高音频数据清洗的准确。并提高音频数据清洗的准确。并提高音频数据清洗的准确。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据的清洗方法、装置、电子设备以及存储介质

[0001]本申请涉及音频数据
，更具体地，涉及一种音频数据的清洗方法、装置、电子设备以及存储介质。

技术介绍

[0002]随着科学技术的发展，在网络电话、电话客服等领域的业务中音频数据是很重要的业务数据，并且声纹的识别的运用领域越来越广泛，大量合格的音频数据和正确的标签对于深度学习的训练来说尤为重要，可以大幅地提高神经网络模型的精度，因此需要对音频数据进行清洗。目前，音频数据庞大，依靠人工清洗数据，导致音频数据的清洗效率较低，并容易出现错误。

技术实现思路

[0003]鉴于上述问题，本申请提出了一种音频数据的清洗方法、装置、电子设备以及存储介质，以解决上述问题。
[0004]第一方面，本申请实施例提供了一种音频数据的清洗方法，所述方法包括：获取待清洗音频数据；获取所述待清洗音频数据的音频信息；从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法，以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理，从所述待清洗音频数据中筛选出目标音频数据，其中，所述目标音频数据用于进行模型训练。
[0005]第二方面，本申请实施例提供了一种音频数据的清洗装置，所述装置包括：待清洗音频数据获取模块，用于获取待清洗音频数据；音频信息获取模块，用于获取所述待清洗音频数据的音频信息；音频数据清洗模块，用于从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法，以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理，从所述待清洗...

【技术保护点】

【技术特征摘要】
1.一种音频数据的清洗方法，其特征在于，所述方法包括：获取待清洗音频数据；获取所述待清洗音频数据的音频信息；从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法，以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理，从所述待清洗音频数据中筛选出目标音频数据，其中，所述目标音频数据用于进行模型训练。2.根据权利要求1所述的方法，其特征在于，所述从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法，以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理，从所述待清洗音频数据中筛选出目标音频数据，包括：对所述音频信息对应的发言人数量进行检测；当检测到所述音频信息对应的发言人数量为多个时，对所述音频信息对应的声道进行检测，获得声道检测结果；基于所述声道检测结果，从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法，以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理，从所述待清洗音频数据中筛选出目标音频数据。3.根据权利要求2所述的方法，其特征在于，所述基于所述声道检测结果，从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法，以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理，从所述待清洗音频数据中筛选出目标音频数据，包括：当所述声道检测结果表征所述待清洗音频数据为混合声道音频数据时，从多个音频处理算法中选择第一音频处理算法作为目标音频处理算法，以及基于所述第一音频处理算法对所述待清洗音频数据进行人声分离处理，获得多条单发言人的音频数据，作为所述目标音频数据；或者当所述声道检测结果表征所述待清洗音频数据为单声道音频数据时，从多个音频处理算法中选择第二音频处理算法作为目标音频处理算法，以及基于所述第二音频处理算法对所述待清洗音频数据进行声道分离处理，获得多条单发言人的音频数据，作为所述目标音频数据。4.根据权利要求2所述的方法，其特征在于，所述方法还包括：当检测到所述音频信息对应的发言人数量为多个时，对所述待清洗音频数据对应的发言人的角色区分度进行检测；当检测到所述待清洗音频数据对应的发言人的角色区分度大于区分度阈值时，从所述多个音频处理算法中选择第三音频处理算法作为目标音频处理算法，以及基于所述第三音频处理算法对所述待清洗音频进行角色区分，从所述待清洗音频数据中筛选出对应目标角色的待清洗音频数据，作为目标音频数据。5.根据权利要求1
‑
4任一项所述的方法，其特征在于，所述从多个音频处理算法中选择与所述音频信息对应的目标音频处理算法，以及基于所述目标音频处理算法对所述待清洗音频数据进行清洗处理，从所述待清洗音频数据中筛选出目标音频数据，包括：从多个音频处理算法中...

【专利技术属性】
技术研发人员：黄润乾，陈东鹏，
申请(专利权)人：深圳市声扬科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人