钢板切头尾时扩充钢板剪切掉落音频数据集的生成方法技术

技术编号：35440605 阅读：13 留言：0更新日期：2022-11-03 11:51

本发明专利技术属于深度学习领域，具体涉及一种钢板切头尾时扩充钢板剪切掉落音频数据集的数据生成方法，用于头尾掉落状态的辨识。首先，通过Wavenet语音生成网络对获取到的少样本音频数据集进行膨胀卷积训练，并利用时间序列模型不断迭代生成预测音频数据集；同时，针对生成的未配对类型数据，利用CycleGan网络学习其数据分布并计算生成数据与预测数据之间的损失函数与相似度，生成与真实音频数据高度相似的音频波形数据集。本发明专利技术可有效解决钢板剪切掉落音频少样本的问题。落音频少样本的问题。落音频少样本的问题。

全部详细技术资料下载

【技术实现步骤摘要】
钢板切头尾时扩充钢板剪切掉落音频数据集的生成方法

[0001]本专利技术属于深度学习领域，具体涉及一种钢板切头尾时扩充钢板剪切掉落音频数据集的生成方法，用于板带生产线上钢板切头尾时头尾掉落状态的辨识。

技术介绍

[0002]随着智能制造的提出，钢铁制造业正全面面向数字化、无人化、智能化发展。在钢厂板带生产线上钢板切头尾时，判别剪切过程中钢板是否正常掉落的情况，传统模式下主要依靠技术人员的经验判断，不仅耗时，还有现场噪声大、生产效率低、危险指数高等缺点。
[0003]通过神经网络训练模型可对钢板剪切掉落的声音有不错的实时预测判断，但神经网络需要大量的样本数据进行模型训练。实际情况中，无法采集到大量的数据样本，异常掉落的样本数据更难获取。在此背景下，许多基于深度学习的数据增强算法和数据生成网络应运而生。
[0004]现有技术中，针对图像生成数据和增强数据的解决方法有：PixelCNN算法是以卷积核的形式不断生成新的像素点，但针对语音数据的波形图像素点的生成有一定的局限性并且生成数据与预测数据差异不大；VAE算法是利用灰度值分布的最大期望概率生成数据，但灰度值分布不能很好的作为语音波形图的特征项；生成对抗网络 GAN使用较多，但是在一般的GAN网络中，生成器无法将图片的真实度提高到最大值。

技术实现思路

[0005]针对上述技术问题，本专利技术提供一种钢板切头尾时扩充钢板剪切掉落音频数据集的生成方法，以音频的波形图为对象，将Wavenet 语音生成网络与循环一致性生成对抗网络CycleGan...

【技术保护点】

【技术特征摘要】
1.一种钢板切头尾时扩充钢板剪切掉落音频数据集的数据生成方法，其特征在于，所述方法包括：对获取的钢板剪切掉落的真实数据样本集做膨胀卷积运算，生成预测音频数据集；将所述预测音频数据集输入CycleGan网络，通过CycleGan网络训练生成与预测音频数据高度相似的生成数据集，以扩充钢板剪切掉落音频数据集。2.根据权利要求1所述一种钢板切头尾时扩充钢板剪切掉落音频数据集的数据生成方法，其特征在于，所述方法包括以下步骤：步骤一：获取真实数据样本集：所述真实数据样本集包括钢板剪切正常掉落声音的样本和钢板剪切异常掉落声音的样本，且钢板剪切正常掉落声音的样本数多于异常掉落声音的样本数；步骤二：利用Wavenet语音生成网络对所述真实数据样本集做膨胀卷积运算，根据历史时刻和当前时刻的输入预测下一时刻的波形，不断迭代，依据时间序列生成预测音频数据集；步骤三：将生成的所述预测音频数据集输入CycleGan生成网络中，生成与预测音频数据高度相似的生成数据集，并计算生成数据与预测音频数据之间的损失函数与相似度；步骤四：通过不断修正训练损失函数，提高生成数据和预测数据相似度，判别生成数据与预测音频数据的相似度，当相似度达到一定范围时，数据生成完毕，获得与预测音频数据高度相似的音频波形图，不断迭代此过程，达到扩充钢板剪切掉落音频波形图数据集的目的。3.如权利要求2所述一种钢板切头尾时扩充钢板剪切掉落音频数据集的数据生成方法，其特征在于，在步骤二中，在所述Wavenet语音生成网络中设输入层、输出层和两层隐含层，膨胀卷积扩张率参数分别设为1、2、4；在生成过程中，每生成一个点放到输入层的最后一个点，继续迭代生成下一时刻预测值，直到音频数据的时间序列结束，预测出新的序列数据，获得生成预测音频数据集。4.如权利要求2所述一种钢板切头尾时扩充钢板剪切掉落音频数据集的数据生成方法，其特征在于...

【专利技术属性】
技术研发人员：张飞，史瑞，李艳姣，陈娇，郭强，任晓怀，宗胜悦，肖雄，李伟超，毕鹏飞，
申请(专利权)人：北京科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人