一种复杂环境下的自反馈文本分离方法及系统技术方案

技术编号:27413043 阅读:24 留言:0更新日期:2021-02-21 14:28
本发明专利技术公开了一种复杂环境下的自反馈文本分离方法及系统,所述方法包括:检测图像是否存在文本区域,是,则切分出文字区域的最小外接区域;否则输出无待识别文本区域的纯图像结果;将文本区域进行分类,并根据接收到的反馈信息更新文本特征数据;将图像文本进行分离得到白底黑字文本分离结果,并根据接收到的反馈信息更新文本分离算法;对文本分离结果进行评价,并记录造成评估结果不理想的原因;对文本评价效果不好的图像,根据效果差的原因将分类结果进行反馈。本发明专利技术达到了各类型图像从输入到输出清晰白底黑字结果的自动化,以及文本分类器和文本分离器的自动反馈更新,在提高了图像识别结果正确性的同时,扩大了文本分离方法的普适性。法的普适性。法的普适性。

【技术实现步骤摘要】
一种复杂环境下的自反馈文本分离方法及系统


[0001]本专利技术属于图像模式识别和图像处理
,尤其涉及一种复杂环境下的自反馈文本分离方法及系统。

技术介绍

[0002]大数据时代带来了海量信息检索的需求,导致视频和图像中的文本检测和识别问题受到越来越多的关注,而且图像中的文本信息是理解整个图像的重要内容,此时就需要将图像中的文本分离出来。视频和图像中的文本分离应用非常广泛,比如车牌识别、互联网视频内容安全监控、嵌入式应用软件、基于文本的视频图像检索、工业产业自动化等;而且视频和图像的情况也很多样化,比如视频和图像背景复杂、光照度不均匀、失真、退化、文本字符多尺寸多字体多颜色等;这些应用场景和视频图像情况非常多样化,很难一一枚举齐全。将视频和图像中的文本分离出来后,还可能出现新的问题,比如文本字符带底色、倾斜、断线模糊、空心等,将会带来识别结果错误的问题,影响文字识别的正常使用,此时需要评价算法对文本分离结果进行评估。因此,需要一种普适性强的文本分离方法能在复杂环境下根据视频和图像的实际情况选择合适的方法进行文本检测和分离,并保证文本分离结果的有效性,方便后续正确识别文本字符,对于提高识别结果正确率等方面有着非常重要的作用。

技术实现思路

[0003]为解决上述技术问题,本专利技术的目的是提供一种复杂环境下的自反馈文本分离方法及系统;该方法与系统能提供一套完整的图像文本分离流程,自动分析图像是否有文本区域存在,当有文本区域存在时进行文本分离以及分离结果后处理。
[0004]本专利技术的目的通过以下的技术方案来实现:
[0005]一种复杂环境下的自反馈文本分离方法,包括
[0006]A检测图像是否存在文本区域,是,则切分出文字区域的最小外接区域;否则输出无待识别文本区域的纯图像结果;
[0007]B将文本区域进行分类,并根据接收到的反馈信息更新文本特征数据;
[0008]C将图像文本进行分离得到白底黑字文本分离结果,并根据接收到的反馈信息更新文本分离算法;
[0009]D对文本分离结果进行评价,并记录造成评估结果不理想的原因;
[0010]E对文本评价效果不好的图像,根据效果差的原因将分类结果进行反馈。
[0011]一种复杂环境下的自反馈文本分离系统,包括
[0012]所述系统包括:文本检测模块、文本分类模块,文本分离模块,文本评价模块和结果反馈模块;所述
[0013]文本检测模块,通过文本检测器检测图像是否存在文本区域,是,则切分出文字区域的最小外接区域;否则输出无待识别文本区域的纯图像结果;
[0014]文本分类模块,通过文本分类器将文本区域进行分类,并根据结果反馈模块的信息更新文本分类器的特征数据;
[0015]文本分离模块,通过文本分离器进行图像文本分离得到白底黑字的文本分离结果,且要根据结果反馈模块的信息更新文本分离器的文本分离算法;
[0016]文本评价模块,通过文本评价器对文本分离结果进行评估,并记录造成评估结果不理想的原因;
[0017]结果反馈模块,用于对文本评价模块评估的效果不好的图像,根据效果差的原因将分类器分类结果和分离器采用的分离技术反馈到文本分类模块和文本分离模块。
[0018]与现有技术相比,本专利技术的一个或多个实施例可以具有如下优点:
[0019]通过五大模块可以实现复杂环境下的自反馈文本分离,达到了各类型图像从输入到输出清晰白底黑字结果的自动化,以及文本分类器和文本分离器的自动反馈更新,在提高了图像识别结果正确性的同时,扩大了文本分离方法的普适性。
附图说明
[0020]图1是复杂环境下的自反馈文本分离方法流程图;
[0021]图2是复杂环境下的自反馈文本分离系统实施图;
[0022]图3a-3d是文本分类器分类结果示例-无字纯图;
[0023]图4a-4c是文本分类器分类结果示例-二值图;
[0024]图5a-5c是文本分类器分类结果示例-灰度图;
[0025]图6a-6c是文本分类器分类结果示例-白底黑字彩图;
[0026]图7a-7d是文本分类器分类结果示例-白底彩字彩图;
[0027]图8a-8c是文本分类器分类结果示例-彩底黑字彩图;
[0028]图9a-9c是文本分类器分类结果示例-彩底非黑字彩图;
[0029]图10a-10f是文本分离器文本分离结果示例图。
具体实施方式
[0030]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本专利技术作进一步详细的描述。
[0031]如图1所示,复杂环境下的自反馈文本分离方法流程,包括:
[0032]步骤10检测图像是否存在文本区域,是,则切分出文字区域的最小外接区域;否则输出无待识别文本区域的纯图像结果;
[0033]步骤20将文本区域进行分类,并根据接收到的反馈信息更新文本特征数据;
[0034]步骤30将图像文本进行分离得到白底黑字文本分离结果,并根据接收到的反馈信息更新文本分离算法;
[0035]步骤40对文本分离结果进行评价,并记录造成评估结果不理想的原因;
[0036]步骤50对文本评价效果不好的图像,根据效果差的原因将分类结果进行反馈。
[0037]如图2所示,上述分离方法对应的分离系统包括:文本检测模块、文本分类模块,文本分离模块,文本评价模块和结果反馈模块;所述文本检测模块,通过文本检测器检测图像是否存在文本区域,是,则切分出文字区域的最小外接区域;否则输出无待识别文本区域的
纯图像结果;文本分类模块,通过文本分类器将文本区域进行分类,并根据结果反馈模块的信息更新文本分类器的特征数据;文本分离模块,通过文本分离器进行图像文本分离得到白底黑字的文本分离结果,且要根据结果反馈模块的信息更新文本分离器的文本分离算法;文本评价模块,通过文本评价器对文本分离结果进行评估,并记录造成评估结果不理想的原因;结果反馈模块,用于对文本评价模块评估的效果不好的图像,根据效果差的原因将分类器分类结果和分离器采用的分离技术反馈到文本分类模块和文本分离模块。
[0038]上述步骤10具体包括:
[0039]由于图像中不一定存在文本区域,有必要利用文本检测器检测图像中的文本字符,得到图像文本区域,使后续文本分离和文字识别更准确;
[0040]根据文本区域检测结果将图像分为无字纯图和有字信息图(如图3a-图10f所示);
[0041]对于部分特殊图像,无法确定是否有文本字符存在的判断为无字纯图,并做标记。
[0042]上述步骤20具体包括:
[0043]预先设计文本分类器,对文本区域图像按属性特征进行分类,分为N类;
[0044]根据结果反馈模块的反馈信息,当目前分类器的图像类别不能得到满意的文本分离结果时,及时增加图像分类类别为N+1类、更新文本分类器;
[0045]文本分类器的类别由简单到复杂,比本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种复杂环境下的自反馈文本分离方法,其特征在于,所述方法包括:A检测图像是否存在文本区域,是,则切分出文字区域的最小外接区域;否则输出无待识别文本区域的纯图像结果;B将文本区域进行分类,并根据接收到的反馈信息更新文本特征数据;C将图像文本进行分离得到白底黑字文本分离结果,并根据接收到的反馈信息更新文本分离算法;D对文本分离结果进行评价,并记录造成评估结果不理想的原因;E对文本评价效果不好的图像,根据效果差的原因将分类结果进行反馈。2.如权利要求1所述的复杂环境下的自反馈文本分离方法,其特征在于,所述A具体包括:利用文本检测器检测图像中的文本字符,得到图像文本区域;根据文本区域检测结果将图像分为无字纯图和有字信息图;将不能确定是否有文本字符存在的图像,判断为无字纯图,并做标记。3.如权利要求1所述的复杂环境下的自反馈文本分离方法,其特征在于,所述B具体包括:设计文本分类器,通过文本分类器对文本区域图像按属性特征进行分类,并分为N类;根据反馈信息,当目前分类器的图像类别不能得到满意的文本分离结果时,增加图像分类类别为N+1类、更新文本分类器;所述文本分类器的类别由简单到复杂。4.如权利要求1所述的复杂环境下的自反馈文本分离方法,其特征在于,所述C具体包括:根据文本分离器的设置,每种图像类别采用不同的方法进行文本分离;对文本分离后的文本字符区域进行倾斜纠偏后处理,得到水平或者垂直的文本字符;将水平或垂直的文本字符进行修...

【专利技术属性】
技术研发人员:赵胜男杜兴春周倩竹宋菲菲王长征
申请(专利权)人:同方知网北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1