图像生成方法、装置、设备和存储介质制造方法及图纸

技术编号:34760157 阅读:57 留言:0更新日期:2022-08-31 18:58
本发明专利技术实施例提供一种图像生成方法、装置、设备和存储介质,该方法包括:获取第一图像和第二图像,第一图像中包括第一目标对象对应的第一图像区域,第二图像中包括至少一个对象各自对应的图像区域。在第二图像中确定与第一图像区域尺寸匹配的第二图像区域,根据第二图像区域对应的视觉特征将第一图像区域变换至第二图像区域,以生成第三图像。在缺少第一目标对象对应的图像的情况下,可以借助已有的未包含第一目标对象的第二图像,自动生成包含第一目标对象的第三图像,且第三图像在外观视觉上与第二图像比较接近,生成的图像质量较高。生成的图像质量较高。生成的图像质量较高。

【技术实现步骤摘要】
图像生成方法、装置、设备和存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种图像生成方法、装置、设备和存储介质。

技术介绍

[0002]随着办公自动化和光学字符识别(Optical Character Recognition,简称OCR)技术的发展,在线财务报销成为一种发展趋势。
[0003]用户可以将报销需要用到的票据、卡证拍摄为一张图像提交给财务人员,财务人员将这张图像输入到一个检测模型中,以通过该检测模型自动检测出其中包括的各种卡证、票据,以及每种卡证、票据中包括的关键信息,以实现信息录入。之后,财务人员就可以基于录入的信息完成报销处理。
[0004]为了训练出性能良好的上述检测模型,需要使用大量的、高质量的训练样本,并对训练样本进行标注。但是,对于一种新的卡证、票据,人工收集真实存在的大量训练样本的过程难度较大,效率较低,甚至可能无法收集到满足模型训练需求的大量训练样本。

技术实现思路

[0005]本专利技术实施例提供一种图像生成方法、装置、设备和存储介质,能够快速生成符合要求的图像。
[0006]第一方面,本专利技术实施例提供一种图像生成方法,该方法包括:
[0007]获取第一图像和第二图像,所述第一图像中包括第一目标对象对应的第一图像区域,所述第二图像中包括至少一个对象各自对应的图像区域;
[0008]在所述第二图像中确定与所述第一图像区域尺寸匹配的第二图像区域;
[0009]根据所述第二图像区域对应的视觉特征,将所述第一图像区域变换至所述第二图像区域,以生成第三图像。
[0010]第二方面,本专利技术实施例提供一种图像生成装置,该装置包括:
[0011]获取模块,用于获取第一图像和第二图像,所述第一图像中包括第一目标对象对应的第一图像区域,所述第二图像中包括至少一个对象各自对应的图像区域;
[0012]确定模块,用于在所述第二图像中确定与所述第一图像区域尺寸匹配的第二图像区域;
[0013]变换模块,用于根据所述第二图像区域对应的视觉特征,将所述第一图像区域变换至所述第二图像区域,以生成第三图像。
[0014]第三方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器;其中,存储器上存储有可执行代码,当所述可执行代码被处理器执行时,使处理器至少可以实现如第一方面所述的图像生成方法。
[0015]第四方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使处
理器至少可以实现如第一方面所述的图像生成方法。
[0016]第五方面,本专利技术实施例提供了一种图像生成方法,该方法包括:
[0017]响应于用户设备调用图像生成服务接口的请求,利用所述图像生成服务接口对应的处理资源执行如下步骤:
[0018]获取第一图像和第二图像,所述第一图像中包括第一目标对象对应的第一图像区域,所述第二图像中包括至少一个对象各自对应的图像区域;
[0019]在所述第二图像中确定与所述第一图像区域尺寸匹配的第二图像区域;
[0020]根据所述第二图像区域对应的视觉特征,将所述第一图像区域变换至所述第二图像区域,以生成第三图像。
[0021]第六方面,本专利技术实施例提供了一种图像生成方法,该方法包括:
[0022]获取第一图像和第二图像,所述第一图像中包括目标卡证或目标票据对应的第一图像区域,所述第二图像中包括至少一个报销对象各自对应的图像区域;
[0023]在所述第二图像中确定与所述第一图像区域尺寸匹配的第二图像区域;
[0024]根据所述第二图像区域对应的视觉特征,将所述第一图像区域变换至所述第二图像区域,以生成第三图像;
[0025]以第三图像作为训练样本,训练应用于报销场景的检测模型。
[0026]在本专利技术实施例提供的图像生成方案中,当想要生成包括第一目标对象的多个图像时,首先,获取作为参考的第一图像,第一图像中包括第一目标对象对应的第一图像区域。其次,获取包括至少一个对象各自对应的图像区域的第二图像。之后,从第二图像包含的至少一个图像区域中确定与所述第一图像区域尺寸匹配的第二图像区域,以将第一图像区域变换到该第二图像区域内,替换掉原本的第二图像区域。其中,为了保留原本的第二图像的视觉特征,需要结合原本的第二图像区域的视觉特征来对第一图像区域进行变换,这样使得替换了原第二图像区域的第一图像区域具有与原第二图像区域相匹配的视觉特征,不会与第二图像中的其他图像区域产生很大的视觉偏差。从而,最终在第二图像的基础上,得到了包含第一目标对象的第三图像。
[0027]基于上述过程,选择多个第二图像,针对每个第二图像进行上述处理,最终便可以得到包含第一目标对象的多个图像,且这多个图像继承了第二图像的真实的视觉特征。通过这种图像生成方法,在缺少第一目标对象对应的图像的情况下,可以借助已有的未包含第一目标对象的大量图像,自动生成包含第一目标对象的大量图像,且生成的这大量图像在外观视觉上,与已有的大量图像比较接近,使得生成的图像质量较高。
附图说明
[0028]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029]图1为本专利技术实施例提供的一种图像生成方法的流程图;
[0030]图2为本专利技术实施例提供的一种第一图像的示意图;
[0031]图3为本专利技术实施例提供的一种第二图像的示意图;
[0032]图4为本专利技术实施例提供的一种图像生成结果的示意图;
[0033]图5为本专利技术实施例提供的另一种图像生成结果的示意图;
[0034]图6为本专利技术实施例提供的一种光照特征提取模型的训练过程示意图;
[0035]图7为本专利技术实施例提供的一种光照特征迁移模型的训练过程示意图;
[0036]图8为本专利技术实施例提供的一种第一图像的获取方法的流程图;
[0037]图9为本专利技术实施例提供的一种第一图像生成过程的示意图;
[0038]图10为本专利技术实施例提供的一种图像修复结果的示意图;
[0039]图11为本专利技术实施例提供的一种图像擦除过程的示意图;
[0040]图12为本专利技术实施例提供的一种图像生成方法的应用示意图;
[0041]图13为本专利技术实施例提供的另一种图像生成方法的流程图;
[0042]图14为本专利技术实施例提供的另一种图像生成方法的流程图;
[0043]图15为本专利技术实施例提供的另一种图像生成方法的流程图;
[0044]图16为本专利技术实施例提供的一种图像生成装置的结构示意图;
[0045]图17为与图16所示实施例提供的图像生成装置对应的电子设备的结构示意图。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法,其特征在于,包括:获取第一图像和第二图像,所述第一图像中包括第一目标对象对应的第一图像区域,所述第二图像中包括至少一个对象各自对应的图像区域;在所述第二图像中确定与所述第一图像区域尺寸匹配的第二图像区域;根据所述第二图像区域对应的视觉特征,将所述第一图像区域变换至所述第二图像区域,以生成第三图像。2.根据权利要求1所述的方法,其特征在于,所述根据所述第二图像区域对应的视觉特征,将所述第一图像区域变换至所述第二图像区域,以生成第三图像,包括:对所述第一图像区域进行透视变换,以将所述第一图像区域投影到所述第二图像区域,以得到所述第三图像。3.根据权利要求1所述的方法,其特征在于,所述根据所述第二图像区域对应的视觉特征,将所述第一图像区域变换至所述第二图像区域,以生成第三图像,包括:对所述第一图像区域进行透视变换,以将所述第一图像区域投影到所述第二图像区域,得到第四图像;将所述第二图像的光照特征迁移到所述第四图像,以得到所述第三图像。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:以所述第三图像作为训练样本,训练检测模型,所述检测模型用于识别输入图像中各对象的类别和位置区域。5.根据权利要求1所述的方法,其特征在于,获取第二图像,包括:根据所述第一目标对象对应的第一类别,确定与所述第一类别搭配出现的第二类别;获取包含所述第二类别的对象的所述第二图像,所述至少一个对象中包括所述第二类别的对象。6.根据权利要求2或3所述的方法,其特征在于,所述对所述第一图像区域进行透视变换,以将所述第一图像区域投影到所述第二图像区域,包括:根据所述第一图像区域的顶点坐标和所述第二图像区域的顶点坐标,确定透视变换矩阵;根据所述透视变换矩阵对所述第一图像区域进行透视变换。7.根据权利要求3所述的方法,其特征在于,所述将所述第二图像的光照特征迁移到所述第四图像,以得到所述第三图像,包括:将所述第二图像输入到光照特征提取模型中,以通过所述光照特征提取模型提取出所述第二图像的光照特征;将所述第四图像和所述光照特征输入到光照特征迁移模型中,以通过所述光照特征迁移模型将所述光照特征迁移到所述第四图像。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:输出所述第三图像;响应用户对所述第三图像触发的确认操作或纠正操作。9.根据权利要求2或3所述的方法,其特征在于,所述第一图像是由对所述第一目标对象进行拍摄得到的图像,或者,所述第一图像是由包括第二目标对象的第五图像合成的图像,所述第一目标对象与所述第二目标对象属于同类对象。
10.根据权利要求9所述的方法,其特征在于,所述获取第一图像,包括:获取所述第五图像,所述第五图像中包括第二目标对象对应的第三图像区域,所述第三图像区域内包括与所述第二目标对象中的多个字段对应的多个字段位置区域;从预设的语料库中获取与所述多个字段位置区域对应的多个语料;将所述多个语料对应地替换到所述多个字段位置区域内,以生成所述第一图像,所述第一目标对象与所述第二目标对象的字段内容不同。11.根据权利要求10所述的方法,其特征在于,所述方法还包括:输出与所述第...

【专利技术属性】
技术研发人员:王鹏飞龙如蛟杨志博王永攀
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1