一种图像矫正方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:28981926 阅读:14 留言:0更新日期:2021-06-23 09:29
本申请实施例属于人工智能中的图像处理技术领域,涉及一种图像矫正方法、装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,用户的原始图像数据可存储于区块链中。本申请通过获取原始图像数据的表格线mask图像,该表格线mask图像作为该原始图像数据的描述子,再将该表格线mask图像输入至训练好的图像矫正模型以进行矫正映射操作,得到矫正映射矩阵,最后将该矫正映射矩阵作用于该原始图像数据进行图像矫正操作,使得原始扭曲的图像数据能够矫正成为相对平整的图像数据,本申请相较于传统的图像矫正方法具有更强的鲁棒性,恢复的效果更加平滑,有效提升后续文本检测和识别模块的性能。

【技术实现步骤摘要】
一种图像矫正方法、装置、计算机设备及存储介质
本申请涉及人工智能中的图像处理
,尤其涉及一种图像矫正方法、装置、计算机设备及存储介质。
技术介绍
随着智能手机的普及,文档照片的分析和识别已成为数字化归档的普遍方式,如在AI核保领域每天都有大量清单和表格照片需要进行识别归档。但是,由于物理文档保存或拍照常常存在扭曲和变形,对文字识别以及结构化信息抽取带来了巨大挑战。现有一种图像矫正方法,基于3D建模的实现原理,采用各种测量仪器(例如结构光投影仪)测量原始图像的3D扭曲数据,再对该3D扭曲数据进行数据矫正操作,得到较为平滑的图像数据。然而,申请人发现传统的图像矫正方法普遍不利于商业化推广,由于3D建模所采用的硬件以及软件极其精细化设计和昂贵校准硬件,从而导致传统的图像矫正方法需要消耗极大的成本,由此可见,传统的图像矫正方法存在成本过高、推广适用率较低的问题。
技术实现思路
本申请实施例的目的在于提出一种图像矫正方法、装置、计算机设备及存储介质,以解决传统的图像矫正方法存在成本过高、推广适用率较低的问题。为了解决上述技术问题,本申请实施例提供一种图像矫正方法,采用了如下所述的技术方案:接收用户终端发送的图像矫正请求,所述图像矫正请求至少携带有原始图像数据;将所述原始图像数据输入至表格线识别模型进行表格线生成操作,得到原始掩膜图像;将所述原始掩膜图像输入至训练好的图像矫正模型进行矫正映射操作,得到矫正映射矩阵;基于所述矫正映射矩阵对所述原始图像数据进行图像矫正操作,得到目标图像数据;向所述用户终端发送所述目标图像数据。为了解决上述技术问题,本申请实施例还提供一种图像矫正装置,采用了如下所述的技术方案:请求接收模块,用于接收用户终端发送的图像矫正请求,所述图像矫正请求至少携带有原始图像数据;表格线生成模块,用于将所述原始图像数据输入至表格线识别模型进行表格线生成操作,得到原始掩膜图像;矫正映射模块,用于将所述原始掩膜图像输入至训练好的图像矫正模型进行矫正映射操作,得到矫正映射矩阵;图像矫正模块,用于基于所述矫正映射矩阵对所述原始图像数据进行图像矫正操作,得到目标图像数据;目标图像输出模块,用于向所述用户终端输出所述目标图像数据。为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的图像矫正方法的步骤。为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的图像矫正方法的步骤。与现有技术相比,本申请实施例主要有以下有益效果:本申请提供了一种图像矫正方法,包括:接收用户终端发送的图像矫正请求,所述图像矫正请求至少携带有原始图像数据;将所述原始图像数据输入至表格线识别模型进行表格线生成操作,得到原始掩膜图像;将所述原始掩膜图像输入至训练好的图像矫正模型进行矫正映射操作,得到矫正映射矩阵;基于所述矫正映射矩阵对所述原始图像数据进行图像矫正操作,得到目标图像数据;向所述用户终端发送所述目标图像数据。通过获取原始图像数据的表格线mask图像,该表格线mask图像作为该原始图像数据的描述子,再将该表格线mask图像输入至训练好的图像矫正模型以进行矫正映射操作,得到矫正映射矩阵,最后将该矫正映射矩阵作用于该原始图像数据进行图像矫正操作,使得原始扭曲的图像数据能够矫正成为相对平整的图像数据,本申请相较于传统的图像矫正方法具有更强的鲁棒性,恢复的效果更加平滑,有效提升后续文本检测和识别模块的性能。附图说明为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例一提供的图像矫正方法的实现流程图;图2是本申请实施例一提供的Unet网络的结构示意图;图3是本申请实施例一提供的DocUNet模型的网络结构示意图;图4是本申请实施例一提供的获取图像矫正模型方法的实现流程图;图5是本申请实施例一提供的获取原始掩膜图像的实现流程图;图6是本申请实施例一提供的U-Net网络构建方法的实现流程图;图7是本申请实施例二提供的图像矫正装置的结构示意图;图8是本申请实施例二提供的获取图像矫正模型装置的结构示意图;图9是根据本申请的计算机设备的一个实施例的结构示意图。具体实施方式除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。为了使本
的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。实施例一如图1所示,示出了本申请实施例一提供的图像矫正方法的实现流程图,为了便于说明,仅示出与本申请相关的部分。上述的图像矫正方法,包括以下步骤:步骤S101、步骤S102、步骤S103、步骤S104以及步骤S105。步骤S101:接收用户终端发送的图像矫正请求,图像矫正请求至少携带有原始图像数据。在本申请实施例中,用户终端指的是用于执行本申请提供的预防证件滥用的图像处理方法的终端设备,该用户终端可以是诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端,应当理解,此处对用户终端的举例仅为方便理解,不用于限定本申请。在本申请实施例中,原始图像数据指的是物理文档在保存或拍照的过程中导致采集到的图像出现扭曲或者变形,改原始图像数据若直接应用到后续的文字识别以及结构化信息抽取则会加大后续信息处理的难度,因此,需要对该原始图像数据进行图像矫正,以将原本扭曲变形的文档数字化数据展平成相对平整的图像数据。...

【技术保护点】
1.一种图像矫正方法,其特征在于,包括下述步骤:/n接收用户终端发送的图像矫正请求,所述图像矫正请求至少携带有原始图像数据;/n将所述原始图像数据输入至表格线识别模型进行表格线生成操作,得到原始掩膜图像;/n将所述原始掩膜图像输入至训练好的图像矫正模型进行矫正映射操作,得到矫正映射矩阵;/n基于所述矫正映射矩阵对所述原始图像数据进行图像矫正操作,得到目标图像数据;/n向所述用户终端发送所述目标图像数据。/n

【技术特征摘要】
1.一种图像矫正方法,其特征在于,包括下述步骤:
接收用户终端发送的图像矫正请求,所述图像矫正请求至少携带有原始图像数据;
将所述原始图像数据输入至表格线识别模型进行表格线生成操作,得到原始掩膜图像;
将所述原始掩膜图像输入至训练好的图像矫正模型进行矫正映射操作,得到矫正映射矩阵;
基于所述矫正映射矩阵对所述原始图像数据进行图像矫正操作,得到目标图像数据;
向所述用户终端发送所述目标图像数据。


2.根据权利要求1所述的图像矫正方法,其特征在于,在所述将所述原始掩膜图像输入至训练好的图像矫正模型进行矫正映射操作,得到矫正映射矩阵的步骤之前,还包括:
读取本地数据库,在所述本地数据库中获取标准图像数据;
对所述标准图像数据进行图像变形操作,得到变形图像数据;
将所述标准图像数据以及与所述标准图像数据相对应的变形图像数据作为训练数据集对初始图像矫正模型进行模型训练操作,得到所述训练好的图像矫正模型。


3.根据权利要求2所述的图像矫正方法,其特征在于,所述图像矫正模型由多层次堆叠的带空洞卷积的Dilated_DocUNet模型组成。


4.根据权利要求2所述的图像矫正方法,其特征在于,在所述将所述原始图像数据输入至表格线识别模型进行表格线生成操作,得到原始掩膜图像的步骤之前,还包括:
将所述原始图像数据输入至语义分割模型进行语义分割操作,得到语义分割字段;
基于所述语义分割字段对所述原始图像数据进行字段标注操作,得到携带有字段文本框的中间图像数据;
所述将所述原始图像数据输入至表格线识别模型进行表格线生成操作,得到原始掩膜图像的步骤具体包括:
将所述中间图像数据输入至表格线识别模型进行所述表格线生成操作,得到所述原始掩膜图像。


5.根据权利要求...

【专利技术属性】
技术研发人员:孙超张蓉
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1