【技术实现步骤摘要】
一种屏摄表单图像文本识别方法、装置、设备及存储介质
[0001]本专利技术涉及图像识别
,特别涉及一种屏摄表单图像文本识别方法
、
装置
、
设备及存储介质
。
技术介绍
[0002]当今,图像处理技术已被广泛地应用于各行各业
。
然而,由于技术的局限和物理条件的限制,低质量屏摄表单图像的识别一直是一个重点关注的问题
。
这类图像通常具有高噪声
、
失真和低对比度等问题,这给表单结构检测和文字内容识别带来了巨大挑战
。
现有技术中,采用了伽马变换
、
透视变换等图像预处理操作后再对图像上表单进行检测
。
由于记录电子屏幕的表单数据作为自然拍照的实际场景之一,显示设备的显示元件与拍摄设备的感光元件之间发生阵列混叠,难以避免得产生摩尔纹现象
。
现有技术的图像预处理方法
(
如灰度化
、
伽马变换和透视变换
)
,难以消除图像 ...
【技术保护点】
【技术特征摘要】
1.
一种屏摄表单图像文本识别方法,其特征在于,包括:将目标屏摄表单图像输入至预设摩尔纹消除模型以得到去掉摩尔纹的第一目标像素矩阵,并对所述第一目标像素矩阵进行曝光处理以确定与所述目标屏摄表单图像上的目标表单区域对应的第二目标像素矩阵;将所述第二目标像素矩阵输入至预设表格检测模型以得到目标单元格顶点坐标,并基于所述目标单元格顶点坐标确定单元格像素矩阵;对所述单元格像素矩阵中的单元格进行拼接以得到目标图像,并利用预设光学字符识别技术对所述目标图像进行文本检测以得到所述目标表单区域上的文本
。2.
根据权利要求1所述的屏摄表单图像文本识别方法,其特征在于,所述将目标屏摄表单图像输入至预设摩尔纹消除模型以得到去掉摩尔纹的第一目标像素矩阵之前,还包括:通过预设屏摄图像数据集对初始摩尔纹消除模型进行调整以得到所述预设摩尔纹消除模型
。3.
根据权利要求1所述的屏摄表单图像文本识别方法,其特征在于,所述对所述第一目标像素矩阵进行曝光处理以确定与所述目标屏摄表单图像上的目标表单区域对应的第二目标像素矩阵,包括:基于预设线性变换公式对所述第一目标像素矩阵进行曝光处理以得到曝光后像素矩阵,并基于预设像素裁剪范围对所述曝光后像素矩阵裁剪以得到目标曝光后像素矩阵;根据所述目标曝光后像素矩阵对应的轮廓顶点坐标和预设顶点坐标确定出所述目标屏摄表单图像上的目标表单区域,并通过预设透视变换算法对所述目标表单区域进行校准以得到与所述目标表单区域对应的第二目标像素矩阵
。4.
根据权利要求3所述的屏摄表单图像文本识别方法,其特征在于,所述基于预设线性变换公式对所述第一目标像素矩阵进行曝光处理以得到曝光后像素矩阵,并基于预设像素裁剪范围对所述曝光后像素矩阵裁剪以得到目标曝光后像素矩阵之前,还包括:将所述第一目标像素矩阵由
RGB
颜色空间转换到
HLS
颜色空间;相应的,所述基于预设线性变换公式对所述第一目标像素矩阵进行曝光处理以得到曝光后像素矩阵,并基于预设像素裁剪范围对所述曝光后像素矩阵裁剪以得到目标曝光后像素矩阵之后,还包括:将所述第一目标像素矩阵由
HLS
颜色空间还原为
RGB
颜色空间
。5.
根据权利要求1所述的屏摄表单图像文本识别方法,其特征在于,所述将所述第二目标像素矩阵输...
【专利技术属性】
技术研发人员:程浩宇,刘子星,丁乐,徐煌,
申请(专利权)人:税友软件集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。