一种图文处理方法、系统以及计算机可读存储介质技术方案

技术编号：24997216 阅读：43 留言：0更新日期：2020-07-24 17:59

本发明专利技术涉及一种图文处理方法，包括如下步骤：获取图文混排文件的图像，并对所述图像进行预处理；通过第一神经网络将经预处理的图像进行区域划分；通过第二神经网络确定划分后的图像中的文本区域；以及通过第三神经网络对所述文本区域进行文本识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种图文处理方法、系统以及计算机可读存储介质
本专利技术涉及一种处理图文混排文件的机制，具体而言，涉及一种图文处理方法、系统以及计算机可读存储介质。
技术介绍
在进行数据采集时有时需要对图文混排的文件进行内容识别，例如，为了收集身份信息需要对身份证图像进行采集、识别。然而，传统的识别方法在特征提取、文字区域检测以及文本识别等诸多方面存在缺陷。
技术实现思路
因此，为了能够高效准确地对图文混排的文件进行内容识别，尤其是文字识别，本专利技术提供了一种处理图文混排文件的机制，具体而言：根据本专利技术的一方面，提供一种图文处理方法，包括如下步骤：获取图文混排文件的图像，并对所述图像进行预处理；通过第一神经网络将经预处理的图像进行区域划分；通过第二神经网络确定划分后的图像中的文本区域；以及通过第三神经网络对所述文本区域进行文本识别。在本专利技术的一些实施例中，可选地，确定划分后的图像中的人像区域并进行裁剪。在本专利技术的一些实施例中，可选地，所述方法还包括建立所述人像区域与识别到的文本的映射...

【技术保护点】
1.一种图文处理方法，其特征在于，所述方法包括如下步骤：/n获取图文混排文件的图像，并对所述图像进行预处理；/n通过第一神经网络将经预处理的图像进行区域划分；/n通过第二神经网络确定划分后的图像中的文本区域；以及/n通过第三神经网络对所述文本区域进行文本识别。/n

【技术特征摘要】
1.一种图文处理方法，其特征在于，所述方法包括如下步骤：
获取图文混排文件的图像，并对所述图像进行预处理；
通过第一神经网络将经预处理的图像进行区域划分；
通过第二神经网络确定划分后的图像中的文本区域；以及
通过第三神经网络对所述文本区域进行文本识别。

2.根据权利要求1所述的方法，其特征在于，确定划分后的图像中的人像区域并进行裁剪。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括建立所述人像区域与识别到的文本的映射关系。

4.根据权利要求1-3中任一项所述的方法，其特征在于，所述第一神经网络是YOLO网络，将经预处理的图像输入到YOLO网络，利用YOLO网络对其进行区域划分。

5.根据权利要求4所述的方法，其特征在于，所述第二神经网络是CTPN网络，将划分后的图像输入到CTPN网络，利用CTPN网络确定其中的文本区域。

6.根据权利要求5所述的方法，其特征在于，所述第三神经网络是CRNN网络，将所述文本区域输入到CRNN网络，利用CRNN网络进行文本识别。

7.根据权利要求1所述的方法，其特征在于，所述图文混排文件是身份证件。

8.一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，其特征在于，当所述指令由处理器执行时，使得所述处理器执行如...

【专利技术属性】
技术研发人员：陶民泽，
申请(专利权)人：证通股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人