文档类型图片的识别方法、装置及存储介质制造方法及图纸

技术编号：26846217 阅读：20 留言：0更新日期：2020-12-25 13:09

本公开涉及一种文档类型图片的识别方法、装置及存储介质，以避免图片底层特征对文档类型图片的识别造成干扰，达到提升文档类型图片的识别准确率的目的。该方法包括：将目标图片输入文字定位检测模型，得到所述文字定位检测模型输出的所述目标图片中的文字框信息；根据所述文字框信息，计算所述目标图片中文字区域的大小；若所述文字区域在所述目标图片中的占比大于或等于预设阈值，则确定所述目标图片为文档类型图片。

全部详细技术资料下载

【技术实现步骤摘要】
文档类型图片的识别方法、装置及存储介质
本公开涉及图像识别
，尤其涉及一种文档类型图片的识别方法、装置及存储介质。
技术介绍
图像识别是指利用计算机对图像/图片进行处理、分析和理解，以识别各种不同模式的目标和对象的技术。图像识别技术是应用深度学习算法的一种实践应用。相关技术中，采用通用的监督学习图像分类方法对图像进行识别分类，具体地，先利用收集到的各种类型的图片作为训练样本，并为每一训练样本设置标签，然后利用带标签的训练样本训练得到二分类器，接着通过训练好的二分类器对待识别的图片进行识别并分类。由于采用这种方式训练得到的分类器会学习到图片底层特征，如纹理特征、颜色特征、形状特征等等，因此分类器会将学习到的图片底层特征作为图片分类的一个判断指标。
技术实现思路
为克服相关技术中存在的问题，本公开提供一种文档类型图片的识别方法、装置及存储介质，以避免图片底层特征对文档类型图片的识别造成干扰，达到提升文档类型图片的识别准确率的目的。根据本公开实施例的第一方面，提供一种文档类型图片的识别方法，包括：将目标图片输入文字定位检测模型，得到所述文字定位检测模型输出的所述目标图片中的文字框信息；根据所述文字框信息，计算所述目标图片中文字区域的大小；若所述文字区域在所述目标图片中的占比大于或等于预设阈值，则确定所述目标图片为文档类型图片。可选地，所述目标图片包括多个文字框，其中，每个所述文字框信息包括四个顶点坐标；所述根据所述文字框信息，计算所述目标图片中文字区域的大小...

【技术保护点】
1.一种文档类型图片的识别方法，其特征在于，包括：/n将目标图片输入文字定位检测模型，得到所述文字定位检测模型输出的所述目标图片中的文字框信息；/n根据所述文字框信息，计算所述目标图片中文字区域的大小；/n若所述文字区域在所述目标图片中的占比大于或等于预设阈值，则确定所述目标图片为文档类型图片。/n

【技术特征摘要】
1.一种文档类型图片的识别方法，其特征在于，包括：
将目标图片输入文字定位检测模型，得到所述文字定位检测模型输出的所述目标图片中的文字框信息；
根据所述文字框信息，计算所述目标图片中文字区域的大小；
若所述文字区域在所述目标图片中的占比大于或等于预设阈值，则确定所述目标图片为文档类型图片。

2.根据权利要求1所述的方法，其特征在于，所述目标图片包括多个文字框，其中，每个所述文字框信息包括四个顶点坐标；
所述根据所述文字框信息，计算所述目标图片中文字区域的大小，包括：
针对每一所述文字框，根据该文字框的四个顶点坐标计算该文字框的面积；
计算所述目标图片中所有所述文字框的面积之和，得到所述文字区域的面积值，所述面积值用于表征所述文字区域的大小。

3.根据权利要求2所述的方法，其特征在于，所述文字区域在所述目标图片中的占比为所述文字区域的面积值与所述目标图片的面积值之比。

4.根据权利要求1所述的方法，其特征在于，所述目标图片包括多个文字框，每个所述文字框信息包括所述文字框的轮廓信息；
所述根据所述文字框信息，计算所述目标图片中文字区域的大小，包括：
针对每一所述文字框，将该文字框对应的轮廓内每一像素点的灰度值设置为目标灰度值；
计算所述多个文字框内灰度值为所述目标灰度值的像素点总个数，得到所述文字区域的像素点个数，所述像素点个数用于表征所述文字区域的大小。

5.根据权利要求4...

【专利技术属性】
技术研发人员：姚海，
申请(专利权)人：北京小米松果电子有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人