基于深度学习的文本信息抽取方法技术

技术编号:39645478 阅读:11 留言:0更新日期:2023-12-09 11:13
本公开提供了一种基于深度学习的文本信息抽取方法

【技术实现步骤摘要】
基于深度学习的文本信息抽取方法、装置、设备及介质


[0001]本公开涉及人工智能
,具体涉及一种基于深度学习的文本信息抽取方法

装置

设备及介质


技术介绍

[0002]随着数字化时代的到来,可以对纸质文件进行拍照

上传,实现纸质文件的数字化存储

在上述数字化存储过程中,还可以对以图形形式存储的文件进行文本识别

[0003]现有技术中,可以通过
OCR
技术实现全文本图像的识别

但是,全本图像识别过程中存在下述问题:在全文本图像中出现其他图形标识时,影响文本识别的准确性


技术实现思路

[0004]鉴于上述问题,本公开提供了的一种基于深度学习的文本信息抽取方法

装置

设备

介质和程序产品

[0005]根据本公开的第一个方面,提供了一种基于深度学习的文本信息抽取方法,包括:利用图像方向分类模型,确定已获取的待处理图像的倾斜方向,其中,待处理图像包括用于表征身份信息的特定图形标记和文本信息,图像方向分类,模型是基于深度学习算法训练的;
[0006]基于倾斜方向对待处理图像进行方向矫正,得到第一处理图像;
[0007]根据第一处理图像的色彩信息,从第一处理图像中清除特定图形标记,得到第二处理图像;
[0008]提取第二处理图像中的文本信息;以及<br/>[0009]按照预定格式处理文本信息,以便通过交互界面向用户展示文本信息

[0010]根据本公开的实施例,其中,根据第一处理图像的色彩信息,从第一处理图像中清除特定图形标记,得到第二处理图像,包括:
[0011]根据第一处理图像的色彩信息,确定第一处理图像的红色通道参数矩阵

绿色通道参数矩阵和蓝色通道参数矩阵;
[0012]根据绿色通道参数矩阵和
/
或蓝色通道参数矩阵,更新红色通道参数矩阵,其中,更新后的红色通道参数矩阵中不包括与特定图形标记相关的红色通道参数;
[0013]利用更新后的红色通道参数矩阵

绿色通道参数矩阵和蓝色通道参数矩阵,形成第二处理图像

[0014]根据本公开的实施例,其中,根据绿色通道参数矩阵和
/
或蓝色通道参数矩阵,更新红色通道参数矩阵包括:
[0015]利用绿色通道参数矩阵或蓝色通道参数矩阵替换红色通道参数矩阵;或者
[0016]利用绿色通道参数矩阵和蓝色通道参数矩阵的融合矩阵替换红色通道参数矩阵

[0017]根据本公开的实施例,其中,利用图像方向分类模型,确定已获取的待处理图像的倾斜方向,包括:
[0018]将待处理图像输入图像方向分类模型,输出倾斜方向概率序列,其中,倾斜方向概率序列包括
M
个倾斜方向类各自的概率信息,
M
为正整数,图像方向分类模型包括卷积神经网络;以及
[0019]基于倾斜方向概率序列,确定待处理图像的倾斜方向

[0020]根据本公开的实施例,其中,提取第二处理图像中的文本信息,包括:
[0021]根据第二处理图像中的文本框位置,确定文本区域和非文本区域;
[0022]利用预训练的文本识别模型从文本区域中提取初始文本信息;
[0023]获取目标类型的标准文本信息,其中,目标类型包括手写类型,标准文本信息与待处理图像相对应;以及
[0024]基于标准文本信息对初始文本信息进行内容矫正,得到文本信息

[0025]根据本公开的实施例,还包括:
[0026]根据与待处理图像相关的原始文件的编号,确定标准文本信息,其中,待处理图像包括对原始文件进行拍照或扫描得到的图像

[0027]根据本公开的实施例,其中,按照预定格式处理文本信息,以便通过交互界面向用户展示文本信息包括:
[0028]将文本信息输入命名实体识别模型,输出
N
个实体信息,
N
为正整数;以及
[0029]按照预定格式处理
N
个实体信息,以便通过交互界面向用户展示
N
个实体信息

[0030]本公开的第二方面提供了一种基于深度学习的文本信息抽取装置,包括:
[0031]方向确定模块,用于利用图像方向分类模型,确定已获取的待处理图像的倾斜方向,其中,待处理图像包括用于表征身份信息的特定图形标记和文本信息,图像方向分类,模型是基于深度学习算法训练的;
[0032]方向矫正模块,用于基于倾斜方向对待处理图像进行方向矫正,得到第一处理图像;
[0033]图形清除模块,用于根据第一处理图像的色彩信息,从第一处理图像中清除特定图形标记,得到第二处理图像;
[0034]提取模块,用于提取第二处理图像中的文本信息;以及
[0035]处理模块,用于按照预定格式处理文本信息,以便通过交互界面向用户展示文本信息

[0036]本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述基于深度学习的文本信息抽取方法

[0037]本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述基于深度学习的文本信息抽取方法

[0038]本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述基于深度学习的文本信息抽取方法

[0039]根据本公开的实施例,通过图像方向分类模型确定待处理图像的倾斜方向,针对倾斜方向对待处理图像进行方向矫正,得到第一处理图像,减少了待处理图像的倾斜方向对文本识别准确度的影响,减少了倾斜方向导致的文本识别错误,提升了文本识别的准确性

通过对第一处理图像进行特定图形标记的清除,得到第二处理图像,提升了在特定图形
标记遮盖文字情况下文本提取的准确性

通过对第二处理图像进行文本信息的识别,并将文本信息转换为预定格式,增加了文本信息管理的有效性

此外,通过交互界面向用户展示文本信息,增加了文本信息的可读性,提升了用户体验

附图说明
[0040]通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的

特征和优点将更为清楚,在附图中:
[0041]图1示意性示出了根据本公开实施例的基于深度学习的文本信息抽取方法的应用场景;
[0042]图2示意性示出了根据本公开实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于深度学习的文本信息抽取方法,包括:利用图像方向分类模型,确定已获取的待处理图像的倾斜方向,其中,所述待处理图像包括用于表征身份信息的特定图形标记和文本信息,所述图像方向分类模型是基于深度学习算法训练的;基于所述倾斜方向对所述待处理图像进行方向矫正,得到第一处理图像;根据所述第一处理图像的色彩信息,从所述第一处理图像中清除所述特定图形标记,得到第二处理图像;提取所述第二处理图像中的文本信息;以及按照预定格式处理所述文本信息,以便通过交互界面向用户展示所述文本信息
。2.
根据权利要求1所述的方法,其中,所述根据所述第一处理图像的色彩信息,从所述第一处理图像中清除所述特定图形标记,得到第二处理图像,包括:根据所述第一处理图像的色彩信息,确定所述第一处理图像的红色通道参数矩阵

绿色通道参数矩阵和蓝色通道参数矩阵;根据所述绿色通道参数矩阵和
/
或所述蓝色通道参数矩阵,更新所述红色通道参数矩阵,其中,更新后的红色通道参数矩阵中不包括与所述特定图形标记相关的红色通道参数;利用更新后的红色通道参数矩阵

所述绿色通道参数矩阵和所述蓝色通道参数矩阵,形成所述第二处理图像
。3.
根据权利要求2所述的方法,其中,所述根据所述绿色通道参数矩阵和
/
或所述蓝色通道参数矩阵,更新所述红色通道参数矩阵包括:利用所述绿色通道参数矩阵或所述蓝色通道参数矩阵替换所述红色通道参数矩阵;或者利用所述绿色通道参数矩阵和所述蓝色通道参数矩阵的融合矩阵替换所述红色通道参数矩阵
。4.
根据权利要求1所述的方法,其中,所述利用图像方向分类模型,确定已获取的待处理图像的倾斜方向,包括:将所述待处理图像输入图像方向分类模型,输出倾斜方向概率序列,其中,所述倾斜方向概率序列包括
M
个倾斜方向类各自的概率信息,
M
为正整数,所述图像方向分类模型包括卷积神经网络;以及基于所述倾斜方向概率序列,确定所述待处理图像的倾斜方向
。5.
根据权利要求1所述的方法,其中,所述提取所述...

【专利技术属性】
技术研发人员:郭子瑜胡怀迪马玉辉李学伟邵礼旭梅广旭李泽强王菁华
申请(专利权)人:齐鲁空天信息研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1