图像生成方法、装置、设备和存储介质制造方法及图纸

技术编号：34760157 阅读：57 留言：0更新日期：2022-08-31 18:58

本发明专利技术实施例提供一种图像生成方法、装置、设备和存储介质，该方法包括：获取第一图像和第二图像，第一图像中包括第一目标对象对应的第一图像区域，第二图像中包括至少一个对象各自对应的图像区域。在第二图像中确定与第一图像区域尺寸匹配的第二图像区域，根据第二图像区域对应的视觉特征将第一图像区域变换至第二图像区域，以生成第三图像。在缺少第一目标对象对应的图像的情况下，可以借助已有的未包含第一目标对象的第二图像，自动生成包含第一目标对象的第三图像，且第三图像在外观视觉上与第二图像比较接近，生成的图像质量较高。生成的图像质量较高。生成的图像质量较高。

全部详细技术资料下载

【技术实现步骤摘要】
图像生成方法、装置、设备和存储介质

[0001]本专利技术涉及图像处理
，尤其涉及一种图像生成方法、装置、设备和存储介质。

技术介绍

[0002]随着办公自动化和光学字符识别(Optical Character Recognition，简称OCR)技术的发展，在线财务报销成为一种发展趋势。
[0003]用户可以将报销需要用到的票据、卡证拍摄为一张图像提交给财务人员，财务人员将这张图像输入到一个检测模型中，以通过该检测模型自动检测出其中包括的各种卡证、票据，以及每种卡证、票据中包括的关键信息，以实现信息录入。之后，财务人员就可以基于录入的信息完成报销处理。
[0004]为了训练出性能良好的上述检测模型，需要使用大量的、高质量的训练样本，并对训练样本进行标注。但是，对于一种新的卡证、票据，人工收集真实存在的大量训练样本的过程难度较大，效率较低，甚至可能无法收集到满足模型训练需求的大量训练样本。

技术实现思路

[0005]本专利技术实施例提供一种图像生成方法、装置、设备和存储介质，能够快速生成符合要求的图像。
[0006]第一方面，本专利技术实施例提供一种图像生成方法，该方法包括：
[0007]获取第一图像和第二图像，所述第一图像中包括第一目标对象对应的第一图像区域，所述第二图像中包括至少一个对象各自对应的图像区域；
[0008]在所述第二图像中确定与所述第一图像区域尺寸匹配的第二图像区域；
[0009]根据所述第二图像区域对应的视觉特征，将所述第一图像...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法，其特征在于，包括：获取第一图像和第二图像，所述第一图像中包括第一目标对象对应的第一图像区域，所述第二图像中包括至少一个对象各自对应的图像区域；在所述第二图像中确定与所述第一图像区域尺寸匹配的第二图像区域；根据所述第二图像区域对应的视觉特征，将所述第一图像区域变换至所述第二图像区域，以生成第三图像。2.根据权利要求1所述的方法，其特征在于，所述根据所述第二图像区域对应的视觉特征，将所述第一图像区域变换至所述第二图像区域，以生成第三图像，包括：对所述第一图像区域进行透视变换，以将所述第一图像区域投影到所述第二图像区域，以得到所述第三图像。3.根据权利要求1所述的方法，其特征在于，所述根据所述第二图像区域对应的视觉特征，将所述第一图像区域变换至所述第二图像区域，以生成第三图像，包括：对所述第一图像区域进行透视变换，以将所述第一图像区域投影到所述第二图像区域，得到第四图像；将所述第二图像的光照特征迁移到所述第四图像，以得到所述第三图像。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：以所述第三图像作为训练样本，训练检测模型，所述检测模型用于识别输入图像中各对象的类别和位置区域。5.根据权利要求1所述的方法，其特征在于，获取第二图像，包括：根据所述第一目标对象对应的第一类别，确定与所述第一类别搭配出现的第二类别；获取包含所述第二类别的对象的所述第二图像，所述至少一个对象中包括所述第二类别的对象。6.根据权利要求2或3所述的方法，其特征在于，所述对所述第一图像区域进行透视变换，以将所述第一图像区域投影到所述第二图像区域，包括：根据所述第一图像区域的顶点坐标和所述第二图像区域的顶点坐标，确定透视变换矩阵；根据所述透视变换矩阵对所述第一图像区域进行透视变换。7.根据权利要求3所述的方法，其特征在于，所述将所述第二图像的光照特征迁移到所述第四图像，以得到所述第三图像，包括：将所述第二图像输入到光照特征提取模型中，以通过所述光照特征提取模型提取出所述第二图像的光照特征；将所述第四图像和所述光照特征输入到光照特征迁移模型中，以通过所述光照特征迁移模型将所述光照特征迁移到所述第四图像。8.根据权利要求1所述的方法，其特征在于，所述方法还包括：输出所述第三图像；响应用户对所述第三图像触发的确认操作或纠正操作。9.根据权利要求2或3所述的方法，其特征在于，所述第一图像是由对所述第一目标对象进行拍摄得到的图像，或者，所述第一图像是由包括第二目标对象的第五图像合成的图像，所述第一目标对象与所述第二目标对象属于同类对象。
10.根据权利要求9所述的方法，其特征在于，所述获取第一图像，包括：获取所述第五图像，所述第五图像中包括第二目标对象对应的第三图像区域，所述第三图像区域内包括与所述第二目标对象中的多个字段对应的多个字段位置区域；从预设的语料库中获取与所述多个字段位置区域对应的多个语料；将所述多个语料对应地替换到所述多个字段位置区域内，以生成所述第一图像，所述第一目标对象与所述第二目标对象的字段内容不同。11.根据权利要求10所述的方法，其特征在于，所述方法还包括：输出与所述第...

【专利技术属性】
技术研发人员：王鹏飞，龙如蛟，杨志博，王永攀，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人