图像中文本类别的识别方法、装置、介质及设备制造方法及图纸

技术编号:35527564 阅读:20 留言:0更新日期:2022-11-09 14:49
本申请提供一种图像中文本类别的识别方法、图像中文本类别的识别装置、计算机可读存储介质及电子设备,涉及计算机技术领域,该方法包括:提取待识别图像的文本检测特征、文本区域信息、文本识别特征;对文本检测特征、文本区域信息、文本识别特征分别进行结构化处理,得到多维度参考特征;根据多维度参考特征识别待识别图像中文本内容的类别。这样可以将对应于不同特征提取阶段的文本检测特征、文本区域信息、文本识别特征进行特征提取,从而得到多维度参考特征,再基于多维度参考特征进行图像文本类别的识别,可以得到精度更高的类别识别结果。结果。结果。

【技术实现步骤摘要】
图像中文本类别的识别方法、装置、介质及设备


[0001]本申请涉及计算机
,具体而言,涉及一种图像中文本类别的识别方法、图像中文本类别的识别装置、计算机可读存储介质及电子设备。

技术介绍

[0002]在图像中文本进行特定类型的识别时,通常依赖的是例如光学字符识别模型(Optical Character Recognition,OCR)这一类的模型,这类模型需要先对图像进行特征提取,再基于最终得到的特征识别出图像中的文本,进而对文本进行特定类型的识别,即,是一种先获取文本识别结果,再对文本识别结果进行文本后处理得到文本类型识别结果的方式。该方法需要依赖OCR的文本识别能力,如果OCR的文本识别结果不准确,则容易导致对于文本的特定类型判定也是不准确的。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有方案的信息。

技术实现思路

[0004]本申请的目的在于提供一种图像中文本类别的识别方法、图像中文本类别的识别装置、计算机可读存储介质及本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像中文本类别的识别方法,其特征在于,包括:提取待识别图像的文本检测特征、文本区域信息、文本识别特征;对所述文本检测特征、所述文本区域信息、所述文本识别特征分别进行结构化处理,得到多维度参考特征;根据所述多维度参考特征识别所述待识别图像中文本内容的类别。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述文本检测特征、所述文本区域信息、所述文本识别特征获取所述待识别图像的文本内容。3.根据权利要求1所述的方法,其特征在于,提取待识别图像的文本检测特征、文本区域信息、文本识别特征,包括:从文本识别模型的串行排列的各处理阶段中分别提取待识别图像的文本检测特征、文本区域信息、文本识别特征。4.根据权利要求1所述的方法,其特征在于,所述多维度参考特征包括第一参考特征、第二参考特征、第三参考特征,对所述文本检测特征、所述文本区域信息、所述文本识别特征分别进行结构化处理,得到多维度参考特征,包括:对所述文本检测特征和所述文本区域信息进行特定区域池化处理,得到所述第一参考特征;对所述文本区域信息进行区域特征编码,得到所述第二参考特征;对所述文本识别特征进行文本特征编码,得到所述第三参考特征。5.根据权利要求4所述的方法,其特征在于,对所述文本检测特征和所述文本区域信息进行特定区域池化处理,得到所述第一参考特征,包括:根据所述文本区域信息确定区域坐标集合;基于所述区域坐标集合对所述文本检测特征进行特定区域池化处理,得到所述第一参考特征。6.根据权利要求4所述的方法,其特征在于,对所述文本区域信息进行区域特征编码,得到所述第...

【专利技术属性】
技术研发人员:陈利军王语斌徐敏
申请(专利权)人:同盾科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1