音频处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：27979704 阅读：25 留言：0更新日期：2021-04-06 14:14

本申请提出一种音频处理方法、装置、电子设备及存储介质，涉及互联网技术领域，通过预设的滑动窗口，并按照时间的先后顺序在音频文件中确定出目标音频片段，并在确定目标音频片段为有声片段，且记录的轮次标记为有效音频的情况下，将目标音频片段添加至预先配置的缓冲区；如此，使得缓冲区内保存的音频片段被用于标注训练样本时，能够减少低质量训练样本的比例，从而提高标注的产出率。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、装置、电子设备及存储介质
本申请涉及互联网
，具体而言，涉及一种音频处理方法、装置、电子设备及存储介质。
技术介绍
随着人工智能技术的发展，深度学习模型在生活生产中有了更多的应用，比如人机交互、语音识别、电信诈骗检测等。其中，在对深度学习模型训练之前，需要获取大量有分类标签的训练样本，从而利用对应有分类标签训练样本对深度学习模型进行训练。然而，在对训练样本进行标注的过程中，可能存在大量质量较低的样本，导致标注的产出率较低。
技术实现思路
本申请的目的在于提供一种音频处理方法、装置、电子设备及存储介质，能够提高标注的产出率。为了实现上述目的，本申请采用的技术方案如下：第一方面，本申请提供一种音频处理方法，所述方法包括：按照时间的先后顺序，利用预设的滑动窗口在音频文件中确定出目标音频片段；若确定所述目标音频片段为有声片段，且记录的轮次标记为有效音频，则将所述目标音频片段添加至预先配置的缓冲区；其中，所述轮次标记用于指示当前处理的音频片段为有效

【技术保护点】
1.一种音频处理方法，其特征在于，所述方法包括：/n按照时间的先后顺序，利用预设的滑动窗口在音频文件中确定出目标音频片段；/n若确定所述目标音频片段为有声片段，且记录的轮次标记为有效音频，则将所述目标音频片段添加至预先配置的缓冲区；其中，所述轮次标记用于指示当前处理的音频片段为有效音频或无效音频。/n

【技术特征摘要】
1.一种音频处理方法，其特征在于，所述方法包括：
按照时间的先后顺序，利用预设的滑动窗口在音频文件中确定出目标音频片段；
若确定所述目标音频片段为有声片段，且记录的轮次标记为有效音频，则将所述目标音频片段添加至预先配置的缓冲区；其中，所述轮次标记用于指示当前处理的音频片段为有效音频或无效音频。

2.如权利要求1所述的方法，其特征在于，所述方法还包括：
若确定所述目标音频片段为有声片段，且记录的轮次标记为无效音频，则判断记录的有声计数值是否大于第一阈值；其中，所述有声计数值表征在无效音频状态下连续记录的有声片段的次数；
若所述有声计数值小于或等于所述第一阈值，则丢弃所述目标音频片段，并更新所述有声计数值；其中，更新后的所述有声计数值被用于下一次执行所述判断记录的有声计数值是否大于第一阈值的步骤；
若所述有声计数值大于所述第一阈值，则将所述目标音频片段添加至所述缓冲区，并将所述有声计数值重置，以及将所述轮次标记更新为有效音频。

3.如权利要求1所述的方法，其特征在于，所述方法还包括：
若确定所述目标音频片段为静音片段，且所述轮次标记为无效音频，则丢弃所述目标音频片段。

4.如权利要求1所述的方法，其特征在于，所述方法还包括：
若确定所述目标音频片段为静音片段，且所述轮次标记为有效音频，则更新记录的静音计数值；其中，所述静音计数值表征在有效音频状态下连续记录的静音片段的次数；
判断更新后的所述静音计数值是否大于第二阈值；
若更新后的所述静音计数值小于或等于所述第二阈值，则将所述目标音频片段添加至所述缓冲区；
若更新后的所述静音计数值大于所述第二阈值，则将所述目标音频片段丢弃，并将所述静音计数值重置，以及将所述轮次标记更新为无效音频。

5.如权利要求4所述的方法，其特征在于，若更新后的所述静音计数值大于所述第二阈值，所述方法还包括：
若所述缓冲区内保...

【专利技术属性】
技术研发人员：曾耀武，黄强，谭安林，
申请(专利权)人：广州虎牙科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人