一种基于LSTM网络的音频检测方法、电子设备及存储介质技术

技术编号：24462316 阅读：49 留言：0更新日期：2020-06-10 17:23

本发明专利技术公开了一种基于LSTM网络的音频检测方法、电子设备及存储介质，所述方法包括一种基于LSTM网络的音频检测方法，其特征在于，所述方法包括如下：采集一定数量条的音频数据，对每条音频数据进行分类标记；构建一二分类的分类模型；利用LSTM网络对所述分类模型进行训练；将一段待测音频数据进行截取成多段子音频数据；将待测音频数据的多段子音频数据分别输入到训练好的分类模型进行分类判断；将保留的有效的子音频数据拼接形成有效音频。本发明专利技术对音频段按照时间维度来进行自动的检测，当检测到是无效的音频，自动去除,具备更加人性化的设置，验证准确高，应用便捷高效等特点。

An audio detection method, electronic equipment and storage medium based on LSTM network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于LSTM网络的音频检测方法、电子设备及存储介质
本专利技术涉及餐饮领域，涉及一种基于LSTM网络的音频检测方法，以及相关的电子设备及存储介质。
技术介绍
在语音识别和声纹识别等等的语音相关的技术中，一直存在无效音频的干扰。例如音频中可能存在的过大的噪音，汽车的滴滴声，电话的铃声以及空白的音频段等等。这些无效的音频段的出现，大大的影响了我们整体的语音识别或者声纹识别的效果。因此，检测并且除去它们是十分有必要的。
技术实现思路
本专利技术的目的在于解决现有技术问题，提出能够对音频段按照时间维度来进行自动的检测。本专利技术提供了一种基于LSTM网络的音频检测方法，包括如下步骤：步骤一，采集一定数量条的音频数据，对每条音频数据进行分类标记，每条音频数据标记为有效音频或无效音频；所述一定数量条的音频数据包括第一数量的无效音频数据和第二数量的有效音频数据，所述无效音频包含以下噪音、电话铃声、汽车声的一种或多种；步骤二，构建一二分类的分类模型；所述分类模型可依据无效音频特...

【技术保护点】
1.一种基于LSTM网络的音频检测方法，其特征在于，所述方法包括如下步骤：/n步骤一，采集一定数量条的音频数据，对每条音频数据进行分类标记，每条音频数据标记为有效音频或无效音频；所述一定数量条的音频数据包括第一数量的无效音频数据和第二数量的有效音频数据，/n所述无效音频包含以下噪音、电话铃声、汽车声的一种或多种；/n步骤二，构建一二分类的分类模型；/n所述分类模型可依据无效音频特征和有效音频特征之间的特征差异对音频数据进行分类；/n步骤三，利用LSTM网络对所述分类模型进行训练；/n步骤四，将一段待测音频数据进行截取成多段子音频数据，每条子音频数据的音频长度为T秒；/n步骤五，将待测音频数据的...

【技术特征摘要】
1.一种基于LSTM网络的音频检测方法，其特征在于，所述方法包括如下步骤：
步骤一，采集一定数量条的音频数据，对每条音频数据进行分类标记，每条音频数据标记为有效音频或无效音频；所述一定数量条的音频数据包括第一数量的无效音频数据和第二数量的有效音频数据，
所述无效音频包含以下噪音、电话铃声、汽车声的一种或多种；
步骤二，构建一二分类的分类模型；
所述分类模型可依据无效音频特征和有效音频特征之间的特征差异对音频数据进行分类；
步骤三，利用LSTM网络对所述分类模型进行训练；
步骤四，将一段待测音频数据进行截取成多段子音频数据，每条子音频数据的音频长度为T秒；
步骤五，将待测音频数据的多段子音频数据分别输入到训练好的分类模型进行分类判断；
若某段子音频数据识别为无效，则删除该段无效的子音频数据，若某段子音频数据识别为有效，则保留该段有效的子音频数据。

2.根据权利要求1所述的基于LSTM网络的音频检测方法，其特征在于，
所述利用LSTM网络对所述分类模型进行训练，具体包括：
将所述一定数量条的音频数据进行划分，一部分音频数据划分为训练集，剩余部分音频数据划分为测试集；其中训练集的音频数据数量大于测试集的音频数据数量；
提取所述训练集的音频数据的声学特征，并提取组合特征；
将组合特征输入到LSTM网络中进行分类模型训练；
采用Adam算法进行LSTM网络参数的更新，通过若干次迭代得到训练好的分类模型。

3.根据权利要求2所述的基于LSTM网络的音频检测方法，其特征在于，
所述测试集的无效音频的数量与所述测试集的有效音频的数量比为0...

【专利技术属性】
技术研发人员：白坤，肖龙源，李稀敏，蔡振华，刘晓葳，
申请(专利权)人：厦门快商通科技股份有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人