文本结构化识别方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:31079163 阅读:23 留言:0更新日期:2021-12-01 11:36
本公开的实施例公开了文本结构化识别方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对目标图像中的文本进行识别,得到目标文本信息;根据上述目标文本信息,确定上述目标图像对应的识别模板类别;根据上述识别模板类别对应的光学字符识别算法,对上述目标图像中的文本进行结构化识别,得到文本结构化识别结果。该实施方式实现了提高文本结构化识别的自动化的程度,降低人工成本,提高文本结构化识别的效率。提高文本结构化识别的效率。提高文本结构化识别的效率。

【技术实现步骤摘要】
文本结构化识别方法、装置、电子设备和计算机可读介质


[0001]本公开的实施例涉及计算机
,具体涉及文本结构化识别方法、装置、电子设备和计算机可读介质。

技术介绍

[0002]文本结构化识别,是一种对图片中的文本进行检测和识别,得到结构化文本的一种技术。目前,在对图片中的文本进行结构化识别时,通常采用的方式为:首先,人为确定图片的类型;然后,再根据确定的类型调用对应的光学字符识别算法获取最终的文本结构化识别结果。
[0003]然而,当采用上述方式进行文本结构化识别时,经常会存在如下技术问题:
[0004]需人为确定图片类型,在一定程度上降低了文本结构化识别的自动化的程度,增加了人工使用成本,降低了文本结构化识别的效率。

技术实现思路

[0005]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0006]本公开的一些实施例提出了文本结构化识别方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本结构化识别方法,包括:对目标图像中的文本进行识别,得到目标文本信息;根据所述目标文本信息,确定所述目标图像对应的识别模板类别;根据所述识别模板类别对应的光学字符识别算法,对所述目标图像中的文本进行结构化识别,得到文本结构化识别结果。2.根据权利要求1所述的方法,其中,在所述根据所述目标文本信息,确定所述目标图像对应的识别模板类别之前,所述方法还包括:确定所述目标图像的目标图像特征信息。3.根据权利要求2所述的方法,其中,所述根据所述目标文本信息,确定所述目标图像对应的识别模板类别,包括:将所述目标文本信息和所述目标图像特征信息输入至目标光学字符识别分类器中,得到所述目标图像对应的识别模板类别。4.根据权利要求3所述的方法,其中,在所述将所述目标文本信息和所述目标图像特征信息输入至目标光学字符识别分类器中,得到所述目标图像对应的识别模板类别之前,所述方法还包括:响应于内存中不存在所述目标光学字符识别分类器,获取所述目标光学字符识别分类器对应的目标格式文件;根据所述目标格式文件还原所述目标光学字符识别分类器;将所述目标光学字符识别分类器加载至内存中。5.根据权利要求4所述的方法,其中,所述将所述目标光学字符识别分类器加载至内存中,包括:响应于确定内存中已加载的光学字符识别分类器的数目满足预设条件,删除内存中已加载的光学字符识别分类器中最早加载至内存中的光学字符识别分类器,以及将所述目标光学字符识别分类器加载至内存中。6.根据权利要求2所述的方法,其中,所述目标光学字符识别分类器在训练完成后被转换为...

【专利技术属性】
技术研发人员:王艺颖
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1