复杂装卸场景目标物标注数据集生成方法、系统和存储介质技术方案

技术编号：35658198 阅读：19 留言：0更新日期：2022-11-19 16:55

本发明专利技术是复杂装卸场景目标物标注数据集生成方法、系统和存储介质，针对复杂场景下无人起重装卸目标物的深度学习标注数据耗时问题，通过在GAN网络架构上融合改进的StyleGAN与DatasetGAN网络来设计适合本发明专利技术的货物图像检测生成对抗网络，构成准确的含语义标注和关键点标注的数据集，实现通过标记少数示例来合成大型高质量标记数据集的方法和技术，解决训练数据匮乏问题和目标物标注耗时问题，与其他解决数据集匮乏问题的方法相比，本发明专利技术方法生成的可用于监督网络训练的标签数据集，有相当优秀的结果，并为后续利用有监督学习模型提供充足的数据支撑。供充足的数据支撑。供充足的数据支撑。

全部详细技术资料下载

【技术实现步骤摘要】
复杂装卸场景目标物标注数据集生成方法、系统和存储介质

[0001]本专利技术涉及人工智能和计算机视觉识别
，特别是涉及复杂装卸场景目标物标注数据集生成方法和系统的研究。

技术介绍

[0002]传统的起重装卸操作是依靠起重机司机观察识别目标物并操控大小车使吊钩运动至目标物上方进行起吊和卸载。企业使用起重机对包装产品进行人工装车作业，至少需要起重司机、地面辅助扶位人员、车厢辅助扶位人员、装车指挥工等4个工人协同进行。随着人工智能技术的迅猛发展，以人工智能为核心的计算机视觉技术已经在制造业等行业逐步开始深度应用，如何分析和识别复杂场景下采集的图像并作出准确指令控制是行业主要面对的问题。比如，装卸场景存在照明不均匀、场景范围大、物品类型多并混杂等诸多情况时，如何应用机器视觉技术准确识别及精确测量定位包装产品，以控制大小车和吊钩自动操作；又比如，物体纹理灰度特征随时间和天气随机变化大，起重机作业时对光线的遮挡会在目标物上呈现不定形的阴影，如何使得在智能装卸场景下通过机器视觉对目标进行准确检测等。
[0003]要解决这类问题，对起重自动装卸目标物识别过程中使用有监督模型进行训练时，需要构建大型标注数据集，并建立数据的过程十分耗时。因此，相对于标准训练网络的开源数据训练集，通常研究对象的场景图像类别(尤其复杂场景图像)都带有自身特点并且数量有限，如何解决训练数据匮乏问题和目标物标注耗时问题，是行业急需解决的难点痛点。
[0004]无监督学习指根据类别未知的训练样本解决模式识别的各种问题，“监督”的意思可以直观...

【技术保护点】

【技术特征摘要】
1.复杂装卸场景目标物标注数据集生成系统，其特征在于，包括生成器模块、判别器模块、生成图像模块、真实图像模块、真伪判别模块、更新参数模块；所述生成器模块用于建立货物图像检测生成对抗网络并构成准确的含语义标注和关键点标注的数据集；所述判别器模块用于搭建有监督深度学习语义分割模型的训练框架，将真实图像与生成器生成的图像进行判别；所述生成图像模块为生成器模块搭建训练框架后所得的含标注的图像的数据集，包括合成的高清图像、生成的语义标签和关键点标签；所述真实图像模块为真实图像数据含被标注后所得的图像数据集，包括真实图像、真实语义标签和关键点标签；所述真伪判别模块用于将经过判别器模块得到的判别结果计算判别损失，对生成图像模块所得数据集进行真伪判定；所述更新参数模块用于将生成器模型和判别器模型进行参数更新，反复迭代，直至判别器收敛；所述生成器模块由基于样式生成对抗网络StyleGAN框架和DatasetGAN网络框架组成；所述基于样式生成对抗网络StyleGAN框架用于生成可控制的高质量和特征的图像；所述StyleGAN框架包括合成块，所述合成块由上采样模块、调制、解调、1*1卷积块和自适应样本归一化层AdaIN组成；所述DatasetGAN网络框架用于以少量详细标注的图像生成大量的准确的带语义标签的数据集，所述数据集包括语义分割和关键点预测两部分；所述判别器模块采用深度卷积
‑
降采样
‑
LeakyReLU非线性激活的网络结构。2.根据权利要求1所述的复杂装卸场景目标物标注数据集生成系统，其特征在于，所述基于样式生成对抗网络StyleGAN框架的合成块网络改为傅里叶特征输入方式，替换标准StyleGAN框架的常数输入方式，进行特征映射的无限的空间范围的固定，所述傅里叶特征输入方式先通过引入一个固定大小的边界作为近似范围，每一层操作之后再对权重参数进行裁剪。3.根据权利要求1所述的复杂装卸场景目标物标注数据集生成系统，其特征在于，所述基于样式生成对抗网络StyleGAN框架对其自适应样本归一化层AdaIN进行修改，包括去除均值、修改噪声模块B输入位置、修改样式控制向量A输入位置，从而解决生成图像存在语义特征变形的问题；所述样式控制向量A包括放缩因子wi和偏差因子bi；修改后AdaIN层工作过程如(1)式所示：x
i
为特征，y为样式，y包含放缩因子wi和偏差因子bi，w
’
ij
为经过调制和卷积后的解调，i为第i个输入特征图，σ(x)为标准差。4.根据权利要求1所述的复杂装卸场景目标物标注数据集生成系统，其特征在于，所述DatasetGAN网络框架采用WGAN
‑
GP目标函数代替最小化JS散度实现最小化生成器的损失函数；所述WGAN
‑
GP目标函数如式(2)所示：
式中，P
data
是真实分布，P
G
是生成器分布，隐含定义了从P
data
和P
G
采样的点对之间的直线均匀采样的P
penalty
。5.复杂装卸场景目标物标注数据集生成方法，采用权利要求1
‑
4任一项所述的标注数据集生成系统进行，其特征在于，包括以下步骤：步骤S1:生成器前半部分采用基于样式生成对抗网络StyleGAN框架；在StyleGAN框架中，给定输入潜在空间Z中的潜码z,进行归一化处理后输入到8个全连接层FC组成的映射网络f，将输入向量学习的仿射变换得到中间向量w，并将特征解缠后的中间向量w变换为样式控制向量A；步骤S2:生成器StyleGAN框架经9次上采样完成，即由9个合成块组成，最终得到特征向量S；所述合成块由调制、解调、1*1卷积块和归一化层AdaIN、上采样模块组成；首先输入傅里叶特征，经上采样后进行裁剪crop操作，并受样式和噪音模块B施加影响，其中一个样式控制向量A在归一化之后对其影响一次，另外一...

【专利技术属性】
技术研发人员：王国桢，王桂棠，陈永彬，吴佳毅，陈建强，吴黎明，
申请(专利权)人：广州沧恒自动控制科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人