一种图像切分标记方法及其装置制造方法及图纸

技术编号:18351126 阅读:45 留言:0更新日期:2018-07-02 00:49
本申请实施例提供一种图像切分标记方法及其装置,所述方法,包括:对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像;对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记。本申请实施例能够对图像自动切分标记,减少人力消耗,提高了工作效率。

【技术实现步骤摘要】
一种图像切分标记方法及其装置
本申请属于图像识别
,具体涉及一种图像切分标记方法及其装置。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(IntelligentCharacterRecognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。在OCR识别中,图像切分质量的好坏,直接影响OCR的识别率。对一个切错的图像进行OCR识别时,往往无法得到正确的识别结果。为了提升图像切分的准确率,需要获得当前切分算法的准确率,要计算当前切分算法的准确率,则需要将当前切分的结果与正确切分的答案进行对比。制作正确切分答案时通常使用人工进行手工标注,既耗费人力,工作效率也不高。因此,如何实现对图像切分标记,成为现有技术中亟需解决的技术问题。
技术实现思路
本申请实施例解决的技术问题之一在于提供一种图像切分标记方法及其装置,其能够对图像自动切分标记,减少人力消耗,提高了工作效率。本申请实施例提供一种图像切分标记方法,包括:对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像;对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记。在本申请具体实现中,所述对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像包括:获得所述需要进行OCR识别的图像的所有连通域;对所述所有连通域进行分析与处理,得到整体标记图像。在本申请具体实现中,所述对所述所有连通域进行分析与处理,得到整体标记图像包括:删除大于和小于宽、高阈值的连通域;和/或,合并有交集的连通域,或者上下连通域,或者左右连通域。在本申请具体实现中,所述对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记包括:对所述整体标记图像进行一标多的附加标记,将错误标记的多个区块合并为一个区块。在本申请具体实现中,所述对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记还包括:对所述整体标记图像进行多标一的附加标记,将错误标记的一个区块拆分为多个区块。在本申请具体实现中,所述对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记还包括:对所述整体标记图像进行未标记的附加标记,采取自动或者手动方式对未标记区块进行标记。在本申请具体实现中,所述对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记还包括:对所述整体标记图像进行标噪音的附加标记,对噪音区块进行删除。在本申请具体实现中,所述对所述整体标记图像进行标噪音的附加标记,对噪音区块进行删除包括:如果噪音区块的密度小于密度阈值,则直接删除噪音区块;如果噪音区块的密度大于或者等于密度阈值,则将噪音区块进行合并,并删除合并后的噪音区块。对应上述方法,本申请还提供一种图像切分标记装置,包括:整体标记模块,用于对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像;附加标记模块,用于对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记。在本申请具体实现中,所述整体标记模块包括:连通域识别单元,用于获得所述需要进行OCR识别的图像的所有连通域;连通域分析单元,用于对所述所有连通域进行分析与处理,得到整体标记图像。在本申请具体实现中,所述连通域分析单元包括:删除子单元,用于删除大于和小于宽、高阈值的连通域;和/或,合并子单元,用于合并有交集的连通域,或者上下连通域,或者左右连通域。在本申请具体实现中,所述附加标记模块包括:一标多单元,用于对所述整体标记图像进行一标多的附加标记,将错误标记的多个区块合并为一个区块。在本申请具体实现中,所述附加标记模块还包括:多标一单元,用于对所述整体标记图像进行多标一的附加标记,将错误标记的一个区块拆分为多个区块。在本申请具体实现中,所述附加标记模块还包括:未标记单元,用于对所述整体标记图像进行未标记的附加标记,采取自动或者手动方式对未标记区块进行标记。在本申请具体实现中,所述附加标记模块还包括:标噪音单元,用于对所述整体标记图像进行标噪音的附加标记,对噪音区块进行删除。在本申请具体实现中,所述标噪音单元包括:小密度删除子单元,用于如果噪音区块的密度小于密度阈值,则直接删除噪音区块;大密度删除子单元,用于如果噪音区块的密度大于或者等于密度阈值,则将噪音区块进行合并,并删除合并后的噪音区块。本申请实施例通过对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像。之后对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记。因此,本申请实施例能够对需要进行OCR识别的图像进行整体自动标记,再用附加标记进行修正。本申请实施例能够对图像自动切分标记,减少人力消耗,提高了工作效率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本申请提供的一种图像切分标记方法一实施例流程图;图2是本申请提供的一种图像切分标记方法中步骤S1一实施例流程图;图3是本申请提供的一种图像切分标记方法中步骤S12一实施例流程图;图4是本申请提供的一种图像切分标记方法中整体标记后的图像示意图;图5是本申请提供的一种图像切分标记方法中步骤S2一实施例流程图;图6是本申请提供的一种图像切分标记方法中步骤S2另一实施例流程图;图7是本申请提供的一种图像切分标记方法中步骤S2再一实施例流程图;图8是本申请提供的一种图像切分标记方法中步骤S2再一实施例流程图;图9是本申请提供的一种图像切分标记方法中步骤S24一实施例流程图;图10是本申请提供的一种图像切分标记装置一实施例结构图;图11是本申请提供的一种图像切分标记装置中整体标记模块一实施例结构图;图12是本申请提供的一种图像切分标记装置中连通域分析单元一实施例结构图;图13是本申请提供的一种图像切分标记装置中附加标记模块一实施例结构图;图14是本申请提供的一种图像切分标记装置中附加标记模块另一实施例结构图;图15是本申请提供的一种图像切分标记装置中附加标记模块再一实施例结构图;图16是本申请提供的一种图像切分标记装置中附加标记模块再一实施例结构图;图17是本申请提供的一种图像切分标记装置中标噪音单元一实施例结构图;图18是本申请提供的图像切分标记方法的电子设备的硬件结构示意图。具体实施方式本申请实施例通过对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像。之后对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记。因此,本申请实施例能够对需要进行OCR识别的图像进行整体自动标记,再用附加标本文档来自技高网...
一种图像切分标记方法及其装置

【技术保护点】
1.一种图像切分标记方法,其特征在于,包括:对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像;对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记。

【技术特征摘要】
1.一种图像切分标记方法,其特征在于,包括:对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像;对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记。2.如权利要求1所述的方法,其特征在于,所述对需要进行OCR识别的图像进行整体自动标记,获得整体标记图像包括:获得所述需要进行OCR识别的图像的所有连通域;对所述所有连通域进行分析与处理,得到整体标记图像。3.如权利要求2所述的方法,其特征在于,所述对所述所有连通域进行分析与处理,得到整体标记图像包括:删除大于和小于宽、高阈值的连通域;和/或,合并有交集的连通域,或者上下连通域,或者左右连通域。4.如权利要求1所述的方法,其特征在于,所述对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记包括:对所述整体标记图像进行一标多的附加标记,将错误标记的多个区块合并为一个区块。5.如权利要求1所述方法,其特征在于,所述对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记还包括:对所述整体标记图像进行多标一的附加标记,将错误标记的一个区块拆分为多个区块。6.如权利要求1所述方法,其特征在于,所述对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记还包括:对所述整体标记图像进行未标记的附加标记,采取自动或者手动方式对未标记区块进行标记。7.如权利要求1所述的方法,其特征在于,所述对所述整体标记图像进行附加标记,调整所述整体标记图像中的错误标记还包括:对所述整体标记图像进行标噪音的附加标记,对噪音区块进行删除。8.如权利要求7所述的方法,其特征在于,所述对所述整体标记图像进行标噪音的附加标记,对噪音区块进行删除包括:如果噪音区块的密度小于密度阈值,则直接删除噪音区块;如果噪音区块的密度大于或者等于密度...

【专利技术属性】
技术研发人员:兴百桥熊蜀光周迅溢杨镜白建国
申请(专利权)人:北京新唐思创教育科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1