图像识别方法、装置和系统制造方法及图纸

技术编号：27977215 阅读：15 留言：0更新日期：2021-04-06 14:11

本公开实施例提供一种图像识别方法、装置和系统，基于待处理图像中的第一表格线属性确定所述待处理图像的类型，并采用与所述待处理图像的类型相匹配的识别方式，对所述待处理图像进行识别，从而能够为不同类型的待处理图像采用不同的识别方式，提高了对待处理图像进行文本识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法、装置和系统
本公开涉及文本识别
，尤其涉及图像识别方法、装置和系统。
技术介绍
光学字符识别(OpticalCharacterRecognition，OCR)能够将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工。然而，传统的OCR识别方式一般只支持对版面固定的图像进行识别，即，要求待识别的字符在版面中的位置是确定的。对于版面不固定的图像，识别准确度较低。
技术实现思路
本公开提供一种图像识别方法、装置和系统。根据本公开实施例的第一方面，提供一种图像识别方法，所述方法包括：获取待处理图像的第一表格线属性；基于所述第一表格线属性确定所述待处理图像的类型；采用与所述待处理图像的类型相匹配的识别方式，对所述待处理图像进行识别。在一些实施例中，所述基于所述第一表格线属性确定所述待处理图像的类型，包括：基于所述第一表格线属性确定所述待处理图像为表单图像的第一置信度和/或所述待处理图像为非表单图像的第二置信度；基于得到的所述第一置信度和/或第二置信度确定所述待处理图像的类型...

【技术保护点】
1.一种图像识别方法，其特征在于，所述方法包括：/n获取待处理图像的第一表格线属性；/n基于所述第一表格线属性确定所述待处理图像的类型；/n采用与所述待处理图像的类型相匹配的识别方式，对所述待处理图像进行识别。/n

【技术特征摘要】
1.一种图像识别方法，其特征在于，所述方法包括：
获取待处理图像的第一表格线属性；
基于所述第一表格线属性确定所述待处理图像的类型；
采用与所述待处理图像的类型相匹配的识别方式，对所述待处理图像进行识别。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一表格线属性确定所述待处理图像的类型，包括：
基于所述第一表格线属性确定所述待处理图像为表单图像的第一置信度和/或所述待处理图像为非表单图像的第二置信度；
基于得到的所述第一置信度和/或第二置信度确定所述待处理图像的类型。

3.根据权利要求2所述的方法，其特征在于，所述基于得到的所述第一置信度和/或第二置信度确定所述待处理图像的类型，包括：
在所述第一置信度大于第一预设值的情况下，确定所述待处理图像为表单图像；和/或
在所述第二置信度大于第二预设值的情况下，确定所述待处理图像为非表单图像。

4.根据权利要求1至3任意一项所述的方法，其特征在于，所述第一表格线属性包括表格线的清晰度、表格线的完整性以及表格线的数量中的至少一者。

5.根据权利要求1至4任意一项所述的方法，其特征在于，所述待处理图像为表单图像；所述采用与所述待处理图像的类型相匹配的识别方式，对所述待处理图像进行识别，包括：
获取所述待处理图像中由表格线围成的多个待识别区域中文本行的第一属性信息；
基于所述多个待识别区域中文本行的第一属性信息，确定所述多个待识别区域中不同待识别区域之间文本行的相对位置关系；
对所述待处理图像进行文本识别，并基于所述多个待识别区域中不同待识别区域之间文本行的相对位置关系，生成所述待处理图像对应的结构化文本。

6.根据权利要求5所述的方法，其特征在于，一个待识别区域中文本行的第一属性信息包括所述待识别区域中文本行的语义信息和/或位置信息。

7.根据权利要求1至4任意一项所述的方法，其特征在于，所述待处理图像为非表单图像；所述采用与所述待处理图像的类型相匹配的识别方式，对所述待处理图像进行识别，包括：
获取与所述待处理图像对应的模板图像中的第一区域；
确定所述待处理图像中与所述第一区域对应的第二区域，所述待处理图像与所述模板图像的版面排布方式相同，所述第一区域在所述模板图像中的相对位置与所述第二区域在所述待处理图像中的相对位置相同；
基于所述第一区域中的字段的...

【专利技术属性】
技术研发人员：詹明捷，梁鼎，刘学博，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人