图像处理的方法、装置、系统及计算机存储介质制造方法及图纸

技术编号:19547083 阅读:20 留言:0更新日期:2018-11-24 21:10
本发明专利技术实施例提供了一种图像处理的方法、装置、系统及计算机存储介质。所述方法包括:通过如下方式训练得到生成对抗网络,所述生成对抗网络包括生成模型和判别模型:将输入图像输入至生成模型,得到输出图像,其中,所述输出图像与所述输入图像具有不同的风格;将所述输出图像输入至判别模型,得到输出值;根据预定义的损失函数,对生成模型和判别模型进行训练,直到收敛;使用训练好的生成模型,得到与训练好的生成模型的输入图像具有不同风格的目标图像。由此,本发明专利技术实施例能够通过训练得到生成对抗网络,并基于该生成对抗网络的生成模型得到与输入图像具有不同风格的目标图像,从而能够扩充用于车辆检测的数据集,进而保证车辆检测的效果。

Image Processing Method, Device, System and Computer Storage Media

The embodiment of the present invention provides a method, device, system and computer storage medium for image processing. The method comprises the following steps: training to obtain a generating countermeasure network, which includes a generating model and a discriminant model: inputting an input image into the generating model to obtain an output image, in which the output image and the input image have different styles; and inputting the output image into the judgment. According to the predefined loss function, the generated model and the discriminant model are trained until convergence. Using the trained generated model, the target image with different style from the input image of the trained generated model is obtained. Thus, embodiments of the present invention can generate an antagonistic network by training, and based on the generation model of the generated antagonistic network, target images with different styles from the input images can be obtained, thereby expanding the data set for vehicle detection, thereby ensuring the effect of vehicle detection.

【技术实现步骤摘要】
图像处理的方法、装置、系统及计算机存储介质
本专利技术涉及图像处理领域,更具体地涉及一种图像处理的方法、装置、系统及计算机存储介质。
技术介绍
车辆检测是图像检测领域的一个重要方面。车辆检测的效果依赖于大量的数据,即数据集。若数据集中的数据不足会严重影响检测结果的可靠性,并无法适应更广泛的场景。因此,在车辆检测的场景中,期望数据集中存在各种风格的数据,因此,如何获取各种风格的数据是急需解决的问题之一。
技术实现思路
考虑到上述问题而提出了本专利技术。本专利技术提供了一种图像处理的方法、装置、系统及计算机存储介质,能够使用训练好的生成模型生成不同风格的目标图像。根据本专利技术的一方面,提供了一种图像处理的方法,所述方法包括:通过如下方式训练得到生成对抗网络,所述生成对抗网络包括生成模型和判别模型:将输入图像输入至所述生成模型,得到输出图像,其中,所述输出图像与所述输入图像具有不同的风格;将所述输出图像输入至所述判别模型,得到输出值;根据预定义的损失函数,对所述生成模型和所述判别模型进行训练,直到收敛;使用所述训练好的所述生成模型,得到与所述训练好的生成模型的输入图像具有不同风格的目标图像。在本专利技术的一个实施例中,所述根据预定义的损失函数,对所述生成模型和所述判别模型进行训练,直到收敛,包括:根据预定义的多个损失函数的加权和,判断是否收敛。在本专利技术的一个实施例中,所述根据预定义的多个损失函数的加权和,判断是否收敛,包括:若所述多个损失函数的加权和在连续多个迭代中的结果之间的差值小于预设误差值,则确定达到收敛。在本专利技术的一个实施例中,所述预定义的损失函数包括风格损失函数,或者,所述预定义的损失函数包括风格损失函数和材质损失函数。在本专利技术的一个实施例中,所述输出值表示所述输出图像为真实图像的概率。在本专利技术的一个实施例中,所述输入图像为包括车辆的图像。在本专利技术的一个实施例中,还包括:将所述目标图像添加至已有数据集以生成新的数据集;基于所述新的数据集进行车辆检测。根据本专利技术的另一方面,提供了一种图像处理的装置,所述装置用于实现前述方面或各个实施例所述方法的步骤,所述装置包括:训练模块,用于通过如下方式训练得到生成对抗网络,所述生成对抗网络包括生成模型和判别模型:将输入图像输入至所述生成模型,得到输出图像,其中,所述输出图像与所述输入图像具有不同的风格;将所述输出图像输入至所述判别模型,得到输出值;根据预定义的损失函数,对所述生成模型和所述判别模型进行训练,直到收敛;获取模块,用于使用所述训练好的所述生成模型,得到与所述训练好的生成模型的输入图像具有不同风格的目标图像。根据本专利技术的又一方面,提供了一种图像处理的系统,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述方面及各个示例所述的图像处理的方法的步骤。根据本专利技术的再一方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被计算机执行时实现前述方面及各个示例所述的图像处理的方法的步骤。由此,本专利技术实施例能够通过训练得到生成对抗网络,并基于该生成对抗网络的生成模型得到与输入图像具有不同风格的目标图像,从而能够扩充用于车辆检测的数据集,进而能够保证车辆检测的效果。附图说明通过结合附图对本专利技术实施例进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与本专利技术实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1是本专利技术实施例的电子设备的一个示意性框图;图2是本专利技术实施例的图像处理的方法的一个示意性流程图;图3是本专利技术实施例的图像处理的装置的一个示意性框图。具体实施方式为了使得本专利技术的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本专利技术的示例实施例。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。基于本专利技术中描述的本专利技术实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本专利技术的保护范围之内。本专利技术实施例可以应用于电子设备,图1所示为本专利技术实施例的电子设备的一个示意性框图。图1所示的电子设备10包括一个或更多个处理器102、一个或更多个存储装置104、输入装置106、输出装置108、图像传感器110以及一个或更多个非图像传感器114,这些组件通过总线系统112和/或其它形式互连。应当注意,图1所示的电子设备10的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。所述处理器102可以包括CPU1021和GPU1022或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,例如现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或进阶精简指令集机器(AdvancedRISC(ReducedInstructionSetComputer)Machine,ARM)等,并且处理器102可以控制所述电子设备10中的其它组件以执行期望的功能。所述存储装置104可以包括一个或更多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器1041和/或非易失性存储器1042。所述易失性存储器1041例如可以包括随机存取存储器(RandomAccessMemory,RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器1042例如可以包括只读存储器(Read-OnlyMemory,ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或更多个计算机程序指令,处理器102可以运行所述程序指令,以实现各种期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或更多个。所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音),并且可以包括显示器、扬声器等中的一个或更多个。所述图像传感器110可以拍摄用户期望的图像(例如照片、视频等),并且将所拍摄的图像存储在所述存储装置104中以供其它组件使用。当注意,图1所示的电子设备10的组件和结构只是示例性的,尽管图1示出的电子设备10包括多个不同的装置,但是根据需要,其中的一些装置可以不是必须的,其中的一些装置的数量可以更多等等,本专利技术对此不限定。生成对抗网络(GenerativeAdversarialNet,GAN)包括生成模型(generativemodel)和判别模型(discriminativemodel)。生成模型也可以称为生成器(Generator)或生成网络,可以表示为G;判别模型也可以称为判别器(Discriminator)或判别网络,可以表示为D。一般地,G可以接收一个随机的噪声向量z,通过这个噪声生成数据(如图像),记为G(z)。D可以接收G(z)或接收真实图像,以判断所接收的图像为真实图像的概率,假设D所接收的图像表示为x,则D的输出可以表示为本文档来自技高网...

【技术保护点】
1.一种图像处理方法,其特征在于,所述方法包括:通过如下方式训练得到生成对抗网络,所述生成对抗网络包括生成模型和判别模型:将输入图像输入至所述生成模型,得到输出图像,其中,所述输出图像与所述输入图像具有不同的风格;将所述输出图像输入至所述判别模型,得到输出值;根据预定义的损失函数,对所述生成模型和所述判别模型进行训练,直到收敛;使用所述训练好的所述生成模型,得到与所述训练好的生成模型的输入图像具有不同风格的目标图像。

【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:通过如下方式训练得到生成对抗网络,所述生成对抗网络包括生成模型和判别模型:将输入图像输入至所述生成模型,得到输出图像,其中,所述输出图像与所述输入图像具有不同的风格;将所述输出图像输入至所述判别模型,得到输出值;根据预定义的损失函数,对所述生成模型和所述判别模型进行训练,直到收敛;使用所述训练好的所述生成模型,得到与所述训练好的生成模型的输入图像具有不同风格的目标图像。2.根据权利要求1所述的方法,其特征在于,所述根据预定义的损失函数,对所述生成模型和所述判别模型进行训练,直到收敛,包括:根据预定义的多个损失函数的加权和,判断是否收敛。3.根据权利要求2所述的方法,其特征在于,所述根据预定义的多个损失函数的加权和,判断是否收敛,包括:若所述多个损失函数的加权和在连续多个迭代中的结果之间的差值小于预设误差值,则确定达到收敛。4.根据权利要求1所述的方法,其特征在于,所述预定义的损失函数包括风格损失函数,或者,所述预定义的损失函数包括风格损失函数和材质损失函数。5.根据权利要求1所述的方法,其特征在于,所述输出值表示所述输出图像为...

【专利技术属性】
技术研发人员:史桀绮
申请(专利权)人:北京旷视科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1