电池识别模型训练方法、无序抓取方法、设备及存储介质技术

技术编号:38220272 阅读:13 留言:0更新日期:2023-07-25 17:51
本发明专利技术公开了一种电池识别模型训练方法、无序抓取方法、设备及存储介质,该训练方法包括仿真出不同的电池堆放仿真图;由对电池堆放仿真图处理得到的像素矩阵构成仿真训练样本;构建电池识别模型,其包括N个CrossTransformer模型,CrossTransformer模型仅计算每个像素点与该像素点所在行和所在列的其他像素点之间的注意力系数,并将每个像素点替换为该像素点的注意力系数,由注意力系数构成的像素矩阵作为下一个CrossTransformer模型的输入;利用仿真训练样本对电池识别模型训练;利用真实训练样本对电池识别模型进行再训练,得到目标电池识别模型。本发明专利技术具有更优的识别精度。的识别精度。的识别精度。

【技术实现步骤摘要】
电池识别模型训练方法、无序抓取方法、设备及存储介质


[0001]本专利技术属于视觉识别、无序抓取领域,尤其涉及一种电池识别模型训练方法、无序抓取方法、设备及存储介质。

技术介绍

[0002]铅酸电池的回收处理生产线包括三个环节:卸车、放酸、提带回收。当废旧电池进场后,需要从卡车转移到传送带上,该环节为卸车;当电池被规范摆放在传送带上后,需要将电池两端用于提手的提带剪掉回收,该环节为提带回收;随后,进入锯床以前需要保证电池有电极的一面朝上,以保障传送带上的刀片能顺利的锯开电池底部,将酸液放出,该环节为放酸。
[0003]废旧电池重达100多斤,工厂的生产环境较恶劣,无人化需求非常强烈。要实现整条产线的自动化,卸车、放酸、提带回收的关键在于实现电池的视觉识别,视觉识别任务本质上为一个四分类任务,即实现电池、电池光面、电池电极面、电池提带的分类。只要实现电池、电池光面、电池电极面、电池提带的分类,就能通过机械臂完成卸车、放酸、提带回收。
[0004]虽然,视觉识别技术已日臻完善,但是在应用层面还存在很多可行性问题。例如电池识别模型(能够识别电池、电池光面、电池电极面、电池提带)的训练有赖于监督学习,而监督学习需要大量的训练样本,视觉识别技术在铅酸电池回收领域应用属于新技术,目前没有工厂采用视觉识别技术实现铅酸电池回收,因此现场数据很少,导致训练样本严重不足。同时,现场数据本质上是图片,电池无序堆放且数量庞大,导致图片中的像素分布较杂乱,对电池识别模型提取局部细节特征的要求非常高。
[0005]目前主流的图像处理模型均以卷积神经网络(CNN)为基础搭建,但是CNN的特征提取受到卷积核下采样的影响,细节丢失较多,不适合电池识别回收。Transformer模型特征提取在把握全局信息和细节上具有优势,但是Transformer模型需要更多的训练样本,因为Transformer模型结构比卷积神经网络更加复杂。在卷积神经网络中,模型主要由卷积层和池化层构成,而这些层在一定程度上可以共享权重和参数,因此,卷积神经网络可以通过少量的训练样本来有效地学习特征。相反,Transformer模型使用自注意力机制来学习序列之间的依赖关系,这意味着Transformer模型需要考虑序列中每个位置之间的所有交互,并且没有共享的权重或参数,这就导致Transformer模型相对于卷积神经网络需要更多的训练样本来进行训练。此外,Transformer模型还需要进行更长训练时间,因为在训练过程中,Transformer模型需要逐渐理解序列中的结构,并逐渐捕捉更细微的关系,这也需要更多的训练样本,以获得更好的性能。
[0006]因此,在铅酸电池回收产线严重缺少现场数据的情况下,采用需要更多训练样本和训练时间的Transformer模型来进行电池识别,无法达到较好的识别效果。

技术实现思路

[0007]本专利技术的目的在于提供一种电池识别模型训练方法、无序抓取方法、设备及存储
介质,以解决铅酸电池回收现场数据严重缺失情况下,采用需要更多训练样本和训练时间的Transformer模型来进行电池识别,无法达到较好的识别效果的问题。
[0008]本专利技术是通过如下的技术方案来解决上述技术问题的:一种电池识别模型训练方法,所述方法包括以下步骤:构建电池模型,根据所述电池模型仿真出不同姿态电池的堆放图片,得到电池堆放仿真图;对每张所述电池堆放仿真图进行标注,标注内容包括电池、电池光面、电池电极面和提带;对标注后的每张电池堆放仿真图进行预处理,得到对应的像素矩阵,由所有像素矩阵构成仿真训练样本;构建电池识别模型,所述电池识别模型包括N个CrossTransformer模型,每个CrossTransformer模型在注意力系数计算时仅计算每个像素点与该像素点所在行和所在列的其他像素点之间的注意力系数;将像素矩阵中的每个像素点替换为该像素点的注意力系数,由注意力系数构成的像素矩阵作为下一个CrossTransformer模型的输入;利用所述仿真训练样本对所述电池识别模型进行训练,得到训练后的电池识别模型;获取电池回收现场的电池堆放真实图,对所述电池堆放真实图进行标注,标注内容包括电池、电池光面、电池电极面和提带;对标注后的每张电池堆放真实图进行预处理,得到对应的像素矩阵,由所有像素矩阵构成真实训练样本;利用所述真实训练样本对训练后的电池识别模型进行再训练,得到目标电池识别模型。
[0009]进一步地,对所述电池堆放仿真图或所述电池堆放真实图进行预处理的具体实现过程包括:将每张图片转换成像素矩阵;对每个所述像素矩阵进行标准化处理,得到标准化像素矩阵;对每个所述标准化像素矩阵进行数据增广,得到数据增广处理后的像素矩阵。
[0010]进一步地,所述数据增广包括镜像、旋转、缩放、裁剪、平移、高斯噪声。
[0011]进一步地,利用所述仿真训练样本或所述真实训练样本对所述电池识别模型进行训练的具体实现过程包括:在第一个CrossTransformer模型中,对所述像素矩阵中的每个像素点进行特征提取,得到该像素矩阵中每个像素点的特征向量;将每个像素点的特征向量转换成查询矩阵Q、键矩阵K和值矩阵V;根据每个像素点的查询矩阵Q、键矩阵K和值矩阵V计算该像素点与该像素点所在行和所在列的其他像素点之间的注意力系数;将每个像素点替换为对应的注意力系数,由注意力系数构成第一像素矩阵;在第二个CrossTransformer模型中,对所述第一像素矩阵中的每个像素点进行特征提取,得到该第一像素矩阵中每个像素点的特征向量;将每个像素点的特征向量转换成查询矩阵Q、键矩阵K和值矩阵V;根据每个像素点的查询矩阵Q、键矩阵K和值矩阵V计算该像素点与该像素点所在行和所在列的其他像素点之间的注意力系数;将每个像素点替换为对
应的注意力系数,由注意力系数构成第二像素矩阵;依此类推,在第N个CrossTransformer模型中,对所述第N

1像素矩阵中的每个像素点进行特征提取,得到该第N

1像素矩阵中每个像素点的特征向量;将每个像素点的特征向量转换成查询矩阵Q、键矩阵K和值矩阵V;根据每个像素点的查询矩阵Q、键矩阵K和值矩阵V计算该像素点与该像素点所在行和所在列的其他像素点之间的注意力系数;将每个像素点替换为对应的注意力系数,由注意力系数构成第N像素矩阵;将所述第N像素矩阵通过YOLO检测头进行目标预测,得到目标预测向量,所述目标预测向量包括检测框左上角和右下角的坐标值、置信度得分、标签索引以及标签得分,其中所述置信度得分表示检测框内包含目标的概率分数,所述标签索引表示目标的类别,所述标签得分表示所述目标属于所述类别的概率分数。
[0012]进一步地,所述注意力系数的计算公式为:其中,A表示注意力系数,d
k
表示查询矩阵Q、键矩阵K、值矩阵V的特征通道数。
[0013]进一步地,每个所述CrossTransformer模型均包括dropout层,在利用所述真实训练样本对训练后的电池识别模型进行再本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电池识别模型训练方法,其特征在于,所述方法包括以下步骤:构建电池模型,根据所述电池模型仿真出不同姿态电池的堆放图片,得到电池堆放仿真图;对每张所述电池堆放仿真图进行标注,标注内容包括电池、电池光面、电池电极面和提带;对标注后的每张电池堆放仿真图进行预处理,得到对应的像素矩阵,由所有像素矩阵构成仿真训练样本;构建电池识别模型,所述电池识别模型包括N个CrossTransformer模型,每个CrossTransformer模型在注意力系数计算时仅计算每个像素点与该像素点所在行和所在列的其他像素点之间的注意力系数;将像素矩阵中的每个像素点替换为该像素点的注意力系数,由注意力系数构成的像素矩阵作为下一个CrossTransformer模型的输入;利用所述仿真训练样本对所述电池识别模型进行训练,得到训练后的电池识别模型;获取电池回收现场的电池堆放真实图,对所述电池堆放真实图进行标注,标注内容包括电池、电池光面、电池电极面和提带;对标注后的每张电池堆放真实图进行预处理,得到对应的像素矩阵,由所有像素矩阵构成真实训练样本;利用所述真实训练样本对训练后的电池识别模型进行再训练,得到目标电池识别模型。2.根据权利要求1所述的电池识别模型训练方法,其特征在于,对所述电池堆放仿真图或所述电池堆放真实图进行预处理的具体实现过程包括:将每张图片转换成像素矩阵;对每个所述像素矩阵进行标准化处理,得到标准化像素矩阵;对每个所述标准化像素矩阵进行数据增广,得到数据增广处理后的像素矩阵。3.根据权利要求2所述的电池识别模型训练方法,其特征在于,所述数据增广包括镜像、旋转、缩放、裁剪、平移、高斯噪声。4.根据权利要求1所述的电池识别模型训练方法,其特征在于,利用所述仿真训练样本或所述真实训练样本对所述电池识别模型进行训练的具体实现过程包括:在第一个CrossTransformer模型中,对所述像素矩阵中的每个像素点进行特征提取,得到该像素矩阵中每个像素点的特征向量;将每个像素点的特征向量转换成查询矩阵Q、键矩阵K和值矩阵V;根据每个像素点的查询矩阵Q、键矩阵K和值矩阵V计算该像素点与该像素点所在行和所在列的其他像素点之间的注意力系数;将每个像素点替换为对应的注意力系数,由注意力系数构成第一像素矩阵;在第二个CrossTransformer模型中,对所述第一像素矩阵中的每个像素点进行特征提取,得到该第一像素矩阵中每个像素点的特征向量;将每个像素点的特征向量转换成查询矩阵Q、键矩阵K和值矩阵V;根据每个像素点的查询矩阵Q、键矩阵K和值矩阵V计算该像素点与该像素点所在行和所在列的其他像素点之间的注意力系数;...

【专利技术属性】
技术研发人员:彭超甘斌
申请(专利权)人:湖南锐异智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1