图像样本的增广方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36764041 阅读:79 留言:0更新日期:2023-03-08 21:14
本公开涉及一种图像样本的增广方法、装置、电子设备及存储介质,所述方法包括:基于多个源图像,生成每个所述源图像对应的行人区域图像;所述行人区域图像包含行人图像及背景图像;通过预设的生成对抗网络,基于多个行人区域图像,生成每个所述行人区域图像对应的变换图像;基于每个所述变换图像以及每个所述变换图像对应的背景掩码,生成每个所述变换图像对应的行人图像;映射每个所述行人图像至对应的源图像中,以生成多个图像样本。本公开实施例可生成大量图像样本,且生成的图像样本可帮助机器学习模型更好地提取行人特征,进而提高了机器学习模型识别行人的准确率。机器学习模型识别行人的准确率。机器学习模型识别行人的准确率。

【技术实现步骤摘要】
图像样本的增广方法、装置、电子设备及存储介质


[0001]本公开涉及图像处理领域,尤其涉及一种图像样本的增广方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来,机器学习技术在图像目标检测领域占据了主要位置。在训练机器学习模型之前,工程师会对图像样本进行增广,以确保机器学习模型训练时能够获取图像样本的普遍特征。然而,目前的图像样本增广方式仅仅是通过图像的翻转、旋转、模糊等操作处理图像样本,此类图像样本增广方式虽然能够增加图像样本的数量,但是依据所生成的图像样本进行训练所得到的机器学习模型,其识别准确率可能无法满足要求。

技术实现思路

[0003]根据本公开的第一方面,提供了一种图像样本的增广方法,所述方法包括:基于多个源图像,生成每个所述源图像对应的行人区域图像;所述行人区域图像包含行人图像及背景图像;通过预设的生成对抗网络,基于多个行人区域图像,生成每个所述行人区域图像对应的变换图像;基于每个所述变换图像以及每个所述变换图像对应的背景掩码,生成每个所述变换图像对应的行人图像;映射每个所述行人图像至对应的源图像中,以生本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像样本的增广方法,其特征在于,所述方法包括:基于多个源图像,生成每个所述源图像对应的行人区域图像;所述行人区域图像包含行人图像及背景图像;通过预设的生成对抗网络,基于多个行人区域图像,生成每个所述行人区域图像对应的变换图像;基于每个所述变换图像以及每个所述变换图像对应的背景掩码,生成每个所述变换图像对应的行人图像;映射每个所述行人图像至对应的源图像中,以生成多个图像样本。2.根据权利要求1所述的增广方法,其特征在于,所述方法还包括:生成每个所述行人区域图像对应的背景掩码;将每个所述行人区域图像的尺寸变换为预设尺寸,变换为所述预设尺寸的行人区域图像用于生成所述变换图像。3.根据权利要求2所述的增广方法,其特征在于,所述基于多个源图像,生成每个所述源图像对应的行人区域图像,包括:基于至少两张源图像,生成各源图像的标注框;所述标注框用以标注行人所在区域;基于每个所述源图像的标注框,生成每个所述源图像对应的行人区域图像。4.根据权利要求3所述的增广方法,其特征在于,所述基于至少两张源图像,生成各源图像的标注框,包括:获取至少两张源图像;依序从所有源图像中选取当前源图像,并执行以下步骤:基于所述当前源图像中的行人位置,生成至少一个标注框;删除所述当前源图像中标注框尺寸小于预设门限的标注框;确定所述当前源图像是否已不包含任一标注框;在确定所述当前源图像已不包含任一标注框的情况下,获取不同于所述至少两张源图像的源图像作为新的当前源图像,并重新执行基于所述当前源图像中的行人位置,生成至少一个标注框。5.根据权利要求1所述的增广方法,其特征在于,所述基于每个所述变换图像以及每个所述变换图像对应的背景掩码,生成每个所述变换图像对应的行人图像,包括:根据与每个所述变换图像对应的行人区域图像的尺寸,调整每个所述变换图像的尺寸;根据调整后的每个所述变换图像以及每个所述变换图像对应的背景掩码,生成每个所述变换图像对应的行人图像。6.根据权利要求1所述的增广方法,其特征在于,所述基于每...

【专利技术属性】
技术研发人员:林坚刘晓稳刘杨
申请(专利权)人:苏州涟漪信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1