【技术实现步骤摘要】
一种图文处理方法、系统以及计算机可读存储介质
本专利技术涉及一种处理图文混排文件的机制,具体而言,涉及一种图文处理方法、系统以及计算机可读存储介质。
技术介绍
在进行数据采集时有时需要对图文混排的文件进行内容识别,例如,为了收集身份信息需要对身份证图像进行采集、识别。然而,传统的识别方法在特征提取、文字区域检测以及文本识别等诸多方面存在缺陷。
技术实现思路
因此,为了能够高效准确地对图文混排的文件进行内容识别,尤其是文字识别,本专利技术提供了一种处理图文混排文件的机制,具体而言:根据本专利技术的一方面,提供一种图文处理方法,包括如下步骤:获取图文混排文件的图像,并对所述图像进行预处理;通过第一神经网络将经预处理的图像进行区域划分;通过第二神经网络确定划分后的图像中的文本区域;以及通过第三神经网络对所述文本区域进行文本识别。在本专利技术的一些实施例中,可选地,确定划分后的图像中的人像区域并进行裁剪。在本专利技术的一些实施例中,可选地,所述方法还包括建立所述人像区域与识别到的文本的映射 ...
【技术保护点】
1.一种图文处理方法,其特征在于,所述方法包括如下步骤:/n获取图文混排文件的图像,并对所述图像进行预处理;/n通过第一神经网络将经预处理的图像进行区域划分;/n通过第二神经网络确定划分后的图像中的文本区域;以及/n通过第三神经网络对所述文本区域进行文本识别。/n
【技术特征摘要】
1.一种图文处理方法,其特征在于,所述方法包括如下步骤:
获取图文混排文件的图像,并对所述图像进行预处理;
通过第一神经网络将经预处理的图像进行区域划分;
通过第二神经网络确定划分后的图像中的文本区域;以及
通过第三神经网络对所述文本区域进行文本识别。
2.根据权利要求1所述的方法,其特征在于,确定划分后的图像中的人像区域并进行裁剪。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括建立所述人像区域与识别到的文本的映射关系。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述第一神经网络是YOLO网络,将经预处理的图像输入到YOLO网络,利用YOLO网络对其进行区域划分。
5.根据权利要求4所述的方法,其特征在于,所述第二神经网络是CTPN网络,将划分后的图像输入到CTPN网络,利用CTPN网络确定其中的文本区域。
6.根据权利要求5所述的方法,其特征在于,所述第三神经网络是CRNN网络,将所述文本区域输入到CRNN网络,利用CRNN网络进行文本识别。
7.根据权利要求1所述的方法,其特征在于,所述图文混排文件是身份证件。
8.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令由处理器执行时,使得所述处理器执行如...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。