模型训练方法及渲染方法、装置、电子设备及存储介质制造方法及图纸

技术编号:27102988 阅读:23 留言:0更新日期:2021-01-25 18:49
本申请提供了一种模型训练方法及渲染方法、装置、电子设备及存储介质。该模型训练方法,包括:将第一文字图片输入预设神经网络得到渲染参数,所述第一文字图片为去除背景的文字图片;根据所述渲染参数进行渲染,得到第二文字图片;根据所述第二文字图片及第一文字图片计算损失函数的损失值,并根据所述损失值对所述预设神经网络的参数进行更新,得到第一神经网络;若损失值大于预设阈值,则将第一神经网络设置为预设神经网络,并返回至所述将第一文字图片输入预设神经网络的步骤;若损失值小于或等于预设阈值,则将第一神经网络作为目标神经网络模型并停止训练。本申请可以提高文字图片的清晰度,可以提高文字图片的可识别度。可以提高文字图片的可识别度。可以提高文字图片的可识别度。

【技术实现步骤摘要】
模型训练方法及渲染方法、装置、电子设备及存储介质


[0001]本申请涉及图片处理
,具体而言,涉及一种模型训练方法及渲染方法、装置、电子设备及存储介质。

技术介绍

[0002]低分辨率文字图片作为高清文字图片的退化结果,低分辨率文字图片一直被视为相关应用场景例如文字图片识别的难点。目前的做法通常是通过优化硬件(例如,提高硬件分辨率)或改变用户使用习惯(即靠近拍照)来实现对文字图片分辨率的提高,从而导致硬件成本较高或者导致用户体验较差。因此,需要一种基于软件的方案来解决低分辨率文字图片识别难度大的技术问题。
[0003]针对上述问题,目前尚未有有效的技术解决方案。

技术实现思路

[0004]本申请实施例的目的在于提供一种模型训练方法及渲染方法、装置、电子设备及存储介质,可以提高文字图片的清晰度,可以提高文字图片的可识别度。
[0005]第一方面,本申请实施例提供了一种模型训练方法,包括:
[0006]将第一文字图片输入预设神经网络得到渲染参数,所述第一文字图片为去除背景的文字图片;
[0007]根据所述渲染参数进行渲染,得到第二文字图片;
[0008]根据所述第二文字图片及第一文字图片计算损失函数的损失值,并根据所述损失值对所述预设神经网络的参数进行更新,得到第一神经网络;
[0009]若损失值大于预设阈值,则将第一神经网络设置为预设神经网络,并返回至所述将第一文字图片输入预设神经网络的步骤;
[0010]若损失值小于或等于预设阈值,则将第一神经网络作为目标神经网络模型并停止训练。
[0011]可选地,在本申请实施例所述的模型训练方法中,所述根据所述第二文字图片及第一文字图片计算损失函数,包括:
[0012]对所述第二文字图片进行模糊处理,以得到模糊文字图片;
[0013]根据所述模糊文字图片以及所述第一文字图片计算损失函数。
[0014]可选地,在本申请实施例所述的模型训练方法中,所述将第一文字图片输入预设神经网络得到渲染参数之前,还包括:
[0015]获取原始文字图片,并去除所述原始文字图片的背景,得到的第一文字图片。
[0016]可选地,在本申请实施例所述的模型训练方法中,所述去除所述原始文字图片的背景,得到的第一文字图片,包括:
[0017]采用分割模型将所述原始文字图片进行分割处理以将所述原始文字图片中的背景去除,得到第一文字图片。
[0018]可选地,在本申请实施例所述的模型训练方法中,所述根据所述渲染参数进行渲染,得到第二文字图片,包括:
[0019]将所述第一文字图片分割成多个第一文字图块,每一所述第一文字图块中包括一个文字;
[0020]对每一所述第一文字图块进行特征提取,以得到每一第一文字图块对应的第一特征信息,所述第一特征信息包括形状特征信息及颜色特征信息;
[0021]根据所述形状特征信息从字符库搜索对应的目标字符;
[0022]根据所述目标字符、所述颜色特征信息以及所述渲染参数进行渲染以生成第二文字图块,从而得到多个第二文字图块;
[0023]将所述多个第二文字图块拼接形成第二文字图片。
[0024]第二方面,本申请提供了一种渲染方法,包括:
[0025]将目标文字图片输入目标神经网络模型得到渲染参数,所述目标神经网络模型为采用上述任一项所述的方法训练得到的模型,所述目标文字图片为不具有背景的文字图片;
[0026]根据所述渲染参数进行渲染,得到目标渲染图片。
[0027]可选地,在本申请实施例所述的渲染方法中,所述根据所述渲染参数进行渲染,得到目标渲染图片,包括:
[0028]将所述目标文字图片分割成多个第一目标文字图块,每一所述第一目标文字图块中包括一个文字;
[0029]对每一所述第一目标文字图块进行特征提取,以得到每一所述第一目标文字图块对应的第一特征信息,第一特征信息包括形状特征信息及颜色特征信息;
[0030]根据所述形状特征信息从字符库搜索对应的目标字符;
[0031]根据所述目标字符、所述颜色特征信息及所述渲染参数进行渲染生成第二目标文字图块,从而得到多个第二目标文字图块;
[0032]将所述多个第二目标文字图块拼接形成第二目标文字图。
[0033]第三方面,本申请了一种模型训练装置,包括:
[0034]第一获取模块,用于将第一文字图片输入预设神经网络得到渲染参数,所述第一文字图片为去除背景的文字图片;
[0035]第一渲染模块,用于根据所述渲染参数进行渲染,得到第二文字图片;
[0036]第二获取模块,用于根据所述第二文字图片及第一文字图片计算损失函数的损失值,并根据所述损失值对所述预设神经网络的参数进行更新,得到第一神经网络;
[0037]循环模块,用于若损失值大于预设阈值,则将第一神经网络设置为预设神经网络,并返回至第一获取模块,使得第一获取模块执行将第一文字图片输入预设神经网络得到渲染参数;
[0038]第三获取模块,用于若损失值小于或等于预设阈值,则将第一神经网络作为目标神经网络模型并停止训练。
[0039]第四方面,本申请了一种渲染装置,包括:
[0040]第四获取模块,用于将目标文字图片输入目标神经网络模型得到渲染参数,所述目标神经网络模型为上述任一项所述的方法训练得到的模型,所述目标文字图片为不具有
背景的文字图片;
[0041]第二渲染模块,用于根据所述渲染参数进行渲染,得到目标渲染图片。
[0042]第五方面,本申请实施例提供了一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述任一项所述的方法。
[0043]第六方面,本申请实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
[0044]本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0045]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0046]图1为本申请实施例提供的模型训练方法的第一种流程图。
[0047]图2为本申请实施例提供的模型训练方法的第二种流程图。
[0048]图3为本申请实施例提供的渲染方法的一种流程图。
[0049]图4为本申请实施例提供的模型训练装置的一种结构示意图。
[0050]图5为本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:将第一文字图片输入预设神经网络得到渲染参数,所述第一文字图片为去除背景的文字图片;根据所述渲染参数进行渲染,得到第二文字图片;根据所述第二文字图片及第一文字图片计算损失函数的损失值,并根据所述损失值对所述预设神经网络的参数进行更新,得到第一神经网络;若损失值大于预设阈值,则将第一神经网络设置为预设神经网络,并返回至所述将第一文字图片输入预设神经网络的步骤;若损失值小于或等于预设阈值,则将第一神经网络作为目标神经网络模型并停止训练。2.根据权利要求1所述的模型训练方法,其特征在于,所述根据所述第二文字图片及第一文字图片计算损失函数,包括:对所述第二文字图片进行模糊处理,以得到模糊文字图片;根据所述模糊文字图片以及所述第一文字图片计算损失函数。3.根据权利要求1所述的模型训练方法,其特征在于,所述将第一文字图片输入预设神经网络得到渲染参数之前,还包括:获取原始文字图片,并去除所述原始文字图片的背景,得到的第一文字图片。4.根据权利要求3所述的模型训练方法,其特征在于,所述去除所述原始文字图片的背景,得到的第一文字图片,包括:采用分割模型将所述原始文字图片进行分割处理以将所述原始文字图片中的背景去除,得到第一文字图片。5.根据权利要求1所述的模型训练方法,其特征在于,所述根据所述渲染参数进行渲染,得到第二文字图片,包括:将所述第一文字图片分割成多个第一文字图块,每一所述第一文字图块中包括一个文字;对每一所述第一文字图块进行特征提取,以得到每一第一文字图块对应的第一特征信息,所述第一特征信息包括形状特征信息及颜色特征信息;根据所述形状特征信息从字符库搜索对应的目标字符;根据所述目标字符、所述颜色特征信息以及所述渲染参数进行渲染以生成第二文字图块,从而得到多个第二文字图块;将所述多个第二文字图块拼接形成第二文字图片。6.一种渲染方法,其特征在于,包括:将目标文字图片输入目标神经网络模型得到渲染参数,所述目标神经网络模型为采用权利要求1-5任一项所述的方法训练得到的模型,所述目标文字图片为不具有背景的文字...

【专利技术属性】
技术研发人员:周舒畅孙培钦
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1