电池识别模型训练方法、无序抓取方法、设备及存储介质技术

技术编号：38220272 阅读：13 留言：0更新日期：2023-07-25 17:51

本发明专利技术公开了一种电池识别模型训练方法、无序抓取方法、设备及存储介质，该训练方法包括仿真出不同的电池堆放仿真图；由对电池堆放仿真图处理得到的像素矩阵构成仿真训练样本；构建电池识别模型，其包括N个CrossTransformer模型，CrossTransformer模型仅计算每个像素点与该像素点所在行和所在列的其他像素点之间的注意力系数，并将每个像素点替换为该像素点的注意力系数，由注意力系数构成的像素矩阵作为下一个CrossTransformer模型的输入；利用仿真训练样本对电池识别模型训练；利用真实训练样本对电池识别模型进行再训练，得到目标电池识别模型。本发明专利技术具有更优的识别精度。的识别精度。的识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
电池识别模型训练方法、无序抓取方法、设备及存储介质

[0001]本专利技术属于视觉识别、无序抓取领域，尤其涉及一种电池识别模型训练方法、无序抓取方法、设备及存储介质。

技术介绍

[0002]铅酸电池的回收处理生产线包括三个环节：卸车、放酸、提带回收。当废旧电池进场后，需要从卡车转移到传送带上，该环节为卸车；当电池被规范摆放在传送带上后，需要将电池两端用于提手的提带剪掉回收，该环节为提带回收；随后，进入锯床以前需要保证电池有电极的一面朝上，以保障传送带上的刀片能顺利的锯开电池底部，将酸液放出，该环节为放酸。
[0003]废旧电池重达100多斤，工厂的生产环境较恶劣，无人化需求非常强烈。要实现整条产线的自动化，卸车、放酸、提带回收的关键在于实现电池的视觉识别，视觉识别任务本质上为一个四分类任务，即实现电池、电池光面、电池电极面、电池提带的分类。只要实现电池、电池光面、电池电极面、电池提带的分类，就能通过机械臂完成卸车、放酸、提带回收。
[0004]虽然，视觉识别技术已日臻完善，但是在应用层面还存在很多可行性问题。例如电池识别模型（能够识别电池、电池光面、电池电极面、电池提带）的训练有赖于监督学习，而监督学习需要大量的训练样本，视觉识别技术在铅酸电池回收领域应用属于新技术，目前没有工厂采用视觉识别技术实现铅酸电池回收，因此现场数据很少，导致训练样本严重不足。同时，现场数据本质上是图片，电池无序堆放且数量庞大，导致图片中的像素分布较杂乱，对电池识别模型提取局部细节特征的要求非常高。
[0005]目前主...

【技术保护点】

【技术特征摘要】
1.一种电池识别模型训练方法，其特征在于，所述方法包括以下步骤：构建电池模型，根据所述电池模型仿真出不同姿态电池的堆放图片，得到电池堆放仿真图；对每张所述电池堆放仿真图进行标注，标注内容包括电池、电池光面、电池电极面和提带；对标注后的每张电池堆放仿真图进行预处理，得到对应的像素矩阵，由所有像素矩阵构成仿真训练样本；构建电池识别模型，所述电池识别模型包括N个CrossTransformer模型，每个CrossTransformer模型在注意力系数计算时仅计算每个像素点与该像素点所在行和所在列的其他像素点之间的注意力系数；将像素矩阵中的每个像素点替换为该像素点的注意力系数，由注意力系数构成的像素矩阵作为下一个CrossTransformer模型的输入；利用所述仿真训练样本对所述电池识别模型进行训练，得到训练后的电池识别模型；获取电池回收现场的电池堆放真实图，对所述电池堆放真实图进行标注，标注内容包括电池、电池光面、电池电极面和提带；对标注后的每张电池堆放真实图进行预处理，得到对应的像素矩阵，由所有像素矩阵构成真实训练样本；利用所述真实训练样本对训练后的电池识别模型进行再训练，得到目标电池识别模型。2.根据权利要求1所述的电池识别模型训练方法，其特征在于，对所述电池堆放仿真图或所述电池堆放真实图进行预处理的具体实现过程包括：将每张图片转换成像素矩阵；对每个所述像素矩阵进行标准化处理，得到标准化像素矩阵；对每个所述标准化像素矩阵进行数据增广，得到数据增广处理后的像素矩阵。3.根据权利要求2所述的电池识别模型训练方法，其特征在于，所述数据增广包括镜像、旋转、缩放、裁剪、平移、高斯噪声。4.根据权利要求1所述的电池识别模型训练方法，其特征在于，利用所述仿真训练样本或所述真实训练样本对所述电池识别模型进行训练的具体实现过程包括：在第一个CrossTransformer模型中，对所述像素矩阵中的每个像素点进行特征提取，得到该像素矩阵中每个像素点的特征向量；将每个像素点的特征向量转换成查询矩阵Q、键矩阵K和值矩阵V；根据每个像素点的查询矩阵Q、键矩阵K和值矩阵V计算该像素点与该像素点所在行和所在列的其他像素点之间的注意力系数；将每个像素点替换为对应的注意力系数，由注意力系数构成第一像素矩阵；在第二个CrossTransformer模型中，对所述第一像素矩阵中的每个像素点进行特征提取，得到该第一像素矩阵中每个像素点的特征向量；将每个像素点的特征向量转换成查询矩阵Q、键矩阵K和值矩阵V；根据每个像素点的查询矩阵Q、键矩阵K和值矩阵V计算该像素点与该像素点所在行和所在列的其他像素点之间的注意力系数；...

【专利技术属性】
技术研发人员：彭超，甘斌，
申请(专利权)人：湖南锐异智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人