图片生成方法、设备及可读存储介质技术

技术编号:25440820 阅读:28 留言:0更新日期:2020-08-28 22:28
本发明专利技术公开了一种图片生成方法、装置、设备及可读存储介质,该方法包括:调用生成器对仿真图片和真实图片分别处理,生成与仿真图片对应的第一图片和第二图片,以及与真实图片对应的第三图片和第四图片;根据仿真图片与第二图片,真实图片与第四图片,对生成器优化训练;调用判别器对真实图片和第一图片,以及第三图片与仿真图片分别进行辨别,并基于辨别结果对辨别器进行优化训练;在生成器和辨别器均训练完成后,得到目标生成器,以基于目标生成器对接收的待处理图片进行处理,生成多张最终图。本发明专利技术通过目标生成器生成的包含生僻字的最终图片兼顾了随机性、可控性和准确性,实现快速准确的生成大量包含生僻字的最终图片。

【技术实现步骤摘要】
图片生成方法、设备及可读存储介质
本专利技术涉及金融科技(Fintech)
,尤其涉及一种图片生成方法、设备及可读存储介质。
技术介绍
随着金融科技(Fintech),尤其是互联网科技金融的不断发展,越来越多的技术(如人工智能、大数据、云存储等)应用在金融领域,但金融领域也对各类技术提出了更高的要求,如要求快速准确的生成大量用于模型训练的生僻字图片,以提升模型对生僻字识别的准确性。证件文字识别过程中对于生僻字的识别依赖于大量的标注数据,但是自然语言的语料库中生僻字的占比远远不足,甚至出现识别过程中的生僻字未存在于训练集中的情况。当前生僻字图片主要有基于规则生成和基于对抗网络生成;其中,对于基于规则,其从实际使用的真实文件上截取无文字部分作为背景,将生僻字打印在背景上,并通过添加模糊、噪声等方式来让生成的图片更接近真实数据;但该生成的图片与真实图片仍然具有较大的差异性,使得真实图片的泛化能力很差,影响训练后识别的准确性。对于对抗网络,其所生成的内容具有不可控性或者缺少随机性,可能生成不包含生僻字的文字图片,或者每次训练均生成相同的图本文档来自技高网...

【技术保护点】
1.一种图片生成方法,其特征在于,所述图片生成方法包括以下步骤:/n调用生成器对仿真图片和真实图片分别处理,生成与所述仿真图片对应的第一图片和第二图片,以及与所述真实图片对应的第三图片和第四图片;/n根据所述仿真图片与所述第二图片,所述真实图片与所述第四图片,对所述生成器优化训练;/n调用判别器对所述真实图片和第一图片,以及所述第三图片与仿真图片分别进行辨别,并基于辨别结果对所述辨别器进行优化训练;/n在所述生成器和所述辨别器均训练完成后,得到目标生成器,以基于所述目标生成器对接收的待处理图片进行处理,生成多张最终图片。/n

【技术特征摘要】
1.一种图片生成方法,其特征在于,所述图片生成方法包括以下步骤:
调用生成器对仿真图片和真实图片分别处理,生成与所述仿真图片对应的第一图片和第二图片,以及与所述真实图片对应的第三图片和第四图片;
根据所述仿真图片与所述第二图片,所述真实图片与所述第四图片,对所述生成器优化训练;
调用判别器对所述真实图片和第一图片,以及所述第三图片与仿真图片分别进行辨别,并基于辨别结果对所述辨别器进行优化训练;
在所述生成器和所述辨别器均训练完成后,得到目标生成器,以基于所述目标生成器对接收的待处理图片进行处理,生成多张最终图片。


2.如权利要求1所述的图片生成方法,其特征在于,所述判别器包括第一真假判别器和第二真假判别器;
所述调用判别器对所述真实图片和第一图片,以及所述第三图片与仿真图片分别进行辨别,并基于辨别结果对所述辨别器进行优化训练的步骤包括:
基于第二真假判别器对真实图片和第一图片进行辨别,生成所述第二真假判别器中第二交叉熵损失函数的第二真假损失值,并基于第一真假判别器对第三图片与仿真图片进行辨别,生成第一真假判别器中第一交叉熵损失函数的第一真假损失值;
根据所述第一真假损失值和所述第二真假损失值,对所述判别器进行优化训练。


3.如权利要求2所述的图片生成方法,其特征在于,所述基于第二真假判别器对真实图片和第一图片进行辨别,生成所述第二真假判别器中第二交叉熵损失函数的第二真假损失值,并基于第一真假判别器对第三图片与仿真图片进行辨别,生成第一真假判别器中第一交叉熵损失函数的第一真假损失值的步骤包括:
将所述生成器的参数固定不变,并将所述第一图片标记为伪域图片后传输到第二真假判别器,对标记后的所述第一图片进行真假辨别,生成第一辨别结果;
基于所述第二真假辨别器对真实图片和第一图片进行区分辨别,生成第二辨别结果,并根据所述第一辨别结果和所述第二辨别结果,生成所述第二真假判别器中第二交叉熵损失函数的第二真假损失值;
将所述第三图片标记为真域图片后传输到第一真假判别器,对标记后的所述第三图片进行真假辨别,生成第三辨别结果;
基于所述第一真假辨别器对第三图片与仿真图片进行区分辨别,生成第四辨别结果,并根据所述第三辨别结果和所述第四辨别结果,生成所述第一真假判别器中第一交叉熵损失函数的第一真假损失值。


4.如权利要求2所述的图片生成方法,其特征在于,所述判别器还包括第一OCR判别器和第二OCR判别器,所述根据所述第一真假损失值和所述第二真假损失值,对所述判别器进行优化训练的步骤包括:
基于所述第一OCR判别器识别所述仿真图片和所述第三图片中的文字,生成第一OCR判别器中第一损失函数的第一OCR损失值,并基于所述第二OCR判别器识别所述真实图片与所述第一图片中的文字,生成第二OCR判别器中第二损失函数的第二OCR损失值;
判断所述第一真假损失值和所述第二真假损失值是否均小于预设交叉熵阈值,以及所述第一OCR损失值和所述第二OCR损失值是否均小于预设函数阈值;
若所述第一真假损失值和所述第二真假损失值均小于预设交叉熵阈值,且所述第一OCR损失值和所述第二OCR损失值均小于预设函数阈值,则完成所述判别器的训练;
若所述第一真假损失值和所述第二真假损失值中存在任意一项不小于预设交叉熵阈值,或者所述第一OCR损失值和第二OCR损失值中存在任意一项不小于预设函数阈值,则执行调用生成器对仿真图片和真实图片分别处理,生成与所述仿真图片对应的第一图片和第二图片的步骤,以对所述判别器优化训练。


5.如权利要求4所述的图片生成方法,其特征在于,所述基于所述第一OCR判别器识别所述仿真图片和所述第三图片中的文字,生成第一OCR判别器中第一损失函数的第一OCR损失值,并基于所述第二OCR判别器识别所述真实图片与所述第一图片中的文字,生成第二...

【专利技术属性】
技术研发人员:张杰邹雨晗徐倩
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1