基于生成网络的前背景图像混合生成方法及系统技术方案

技术编号：40029246 阅读：12 留言：0更新日期：2024-01-16 17:58

本发明专利技术公开了基于生成网络的前背景图像混合生成方法及系统，该方法包括：获取待识别的人体语义分割图像；引入DCT卷积网络模块单元，构建前背景混合生成网络模型；将待识别的人体语义分割图像输入至前背景混合生成网络模型进行识别，得到最终人体语义图像。该系统包括：获取模块、构建模块和识别模块。本发明专利技术通过引入DCT卷积网络模块单元，构建前背景混合生成网络模型对待识别的人体语义分割图像进行识别生成处理，能够生成更加符合实际场景需求的混合前背景图像。本发明专利技术作为基于生成网络的前背景图像混合生成方法及系统，可广泛应用于图像混合生成技术领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像混合生成，尤其涉及基于生成网络的前背景图像混合生成方法及系统。

技术介绍

1、随着人工智能、深度学习等领域的发展,基于视觉的目标检测获得了长足的发展。与传统基于特征提取的目标检测方法不同，基于深度学习的目标检测方法通过深度神经网络提取图像的深层信息，使用海量的数据进行训练，极大地提高了目标检测的准确率和速度，在目标检测领域中，行人检测是一块重要的组成部分。行人检测就是使用计算机技术在一张图片或者一段视频中判断是否存在行人并在图中框选出行人位置。行人检测在自动驾驶、无人机、监控等领域都有着重要的应用。当前主流的行人检测方法包括：整体检测、基于局部的检测、基于运动的检测、多相机立体视觉检测，现有的基于可见光图像的目标检测因为其设备成本低、适用范围广等特点而受到广泛关注和研究。然而，可见光图像非常容易受到环境的影响。外观变化、遮挡和光照条件变化等因素都会对基于可见光的目标检测产生极大的影响，且现有的检测方法大多数基于离散傅里叶变换(discrete fouriertransform，dft)进行实现，其会引入复频域信号，影响...

【技术保护点】

1.基于生成网络的前背景图像混合生成方法，其特征在于，包括以下步骤：

2.根据权利要求1所述基于生成网络的前背景图像混合生成方法，其特征在于，所述待识别的人体语义分割图像包括第一人体语义分割图像与第二人体语义分割图像，所述第一人体语义分割图像用于提取前景人物图像信息，所述第二人体语义分割图像用于提取背景环境信息。

3.根据权利要求1所述基于生成网络的前背景图像混合生成方法，其特征在于，所述前背景混合生成网络模型包括Mask前景生成器、分离背景模块、对抗生成网络和鉴别器，其中，所述对抗生成网络包括下采样模块、DCT卷积网络模块和上采样模块，所述DCT卷积网络模块包括...

【技术特征摘要】

1.基于生成网络的前背景图像混合生成方法，其特征在于，包括以下步骤：

3.根据权利要求1所述基于生成网络的前背景图像混合生成方法，其特征在于，所述前背景混合生成网络模型包括mask前景生成器、分离背景模块、对抗生成网络和鉴别器，其中，所述对抗生成网络包括下采样模块、dct卷积网络模块和上采样模块，所述dct卷积网络模块包括通道切分操作层、自相关卷积运算层、dct-2d卷积运算层和batchnormalize激活层。

4.根据权利要求3所述基于生成网络的前背景图像混合生成方法，其特征在于，所述将所述待识别的人体语义分割图像输入至所述前背景混合生成网络模型进行识别，得到最终人体语义图像这一步骤，其具体包括：

5.根据权...

【专利技术属性】
技术研发人员：黄志青，余俊，
申请(专利权)人：广州恒沙数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人