一种复杂环境下的自反馈文本分离方法及系统技术方案

技术编号：27413043 阅读：24 留言：0更新日期：2021-02-21 14:28

本发明专利技术公开了一种复杂环境下的自反馈文本分离方法及系统，所述方法包括：检测图像是否存在文本区域，是，则切分出文字区域的最小外接区域；否则输出无待识别文本区域的纯图像结果；将文本区域进行分类，并根据接收到的反馈信息更新文本特征数据；将图像文本进行分离得到白底黑字文本分离结果，并根据接收到的反馈信息更新文本分离算法；对文本分离结果进行评价，并记录造成评估结果不理想的原因；对文本评价效果不好的图像，根据效果差的原因将分类结果进行反馈。本发明专利技术达到了各类型图像从输入到输出清晰白底黑字结果的自动化，以及文本分类器和文本分离器的自动反馈更新，在提高了图像识别结果正确性的同时，扩大了文本分离方法的普适性。法的普适性。法的普适性。

全部详细技术资料下载

【技术实现步骤摘要】
一种复杂环境下的自反馈文本分离方法及系统

[0001]本专利技术属于图像模式识别和图像处理
，尤其涉及一种复杂环境下的自反馈文本分离方法及系统。

技术介绍

[0002]大数据时代带来了海量信息检索的需求，导致视频和图像中的文本检测和识别问题受到越来越多的关注，而且图像中的文本信息是理解整个图像的重要内容，此时就需要将图像中的文本分离出来。视频和图像中的文本分离应用非常广泛，比如车牌识别、互联网视频内容安全监控、嵌入式应用软件、基于文本的视频图像检索、工业产业自动化等；而且视频和图像的情况也很多样化，比如视频和图像背景复杂、光照度不均匀、失真、退化、文本字符多尺寸多字体多颜色等；这些应用场景和视频图像情况非常多样化，很难一一枚举齐全。将视频和图像中的文本分离出来后，还可能出现新的问题，比如文本字符带底色、倾斜、断线模糊、空心等，将会带来识别结果错误的问题，影响文字识别的正常使用，此时需要评价算法对文本分离结果进行评估。因此，需要一种普适性强的文本分离方法能在复杂环境下根据视频和图像的实际情况选择合适的方法进行文本检测和分离，并保证文本分离结果的有效性，方便后续正确识别文本字符，对于提高识别结果正确率等方面有着非常重要的作用。

技术实现思路

[0003]为解决上述技术问题，本专利技术的目的是提供一种复杂环境下的自反馈文本分离方法及系统；该方法与系统能提供一套完整的图像文本分离流程，自动分析图像是否有文本区域存在，当有文本区域存在时进行文本分离以及分离结果后处理。
[0004]本专利技术的目的...

【技术保护点】

【技术特征摘要】
1.一种复杂环境下的自反馈文本分离方法，其特征在于，所述方法包括：A检测图像是否存在文本区域，是，则切分出文字区域的最小外接区域；否则输出无待识别文本区域的纯图像结果；B将文本区域进行分类，并根据接收到的反馈信息更新文本特征数据；C将图像文本进行分离得到白底黑字文本分离结果，并根据接收到的反馈信息更新文本分离算法；D对文本分离结果进行评价，并记录造成评估结果不理想的原因；E对文本评价效果不好的图像，根据效果差的原因将分类结果进行反馈。2.如权利要求1所述的复杂环境下的自反馈文本分离方法，其特征在于，所述A具体包括：利用文本检测器检测图像中的文本字符，得到图像文本区域；根据文本区域检测结果将图像分为无字纯图和有字信息图；将不能确定是否有文本字符存在的图像，判断为无字纯图，并做标记。3.如权利要求1所述的复杂环境下的自反馈文本分离方法，其特征在于，所述B具体包括：设计文本分类器，通过文本分类器对文本区域图像按属性特征进行分类，并分为N类；根据反馈信息，当目前分类器的图像类别不能得到满意的文本分离结果时，增加图像分类类别为N+1类、更新文本分类器；所述文本分类器的类别由简单到复杂。4.如权利要求1所述的复杂环境下的自反馈文本分离方法，其特征在于，所述C具体包括：根据文本分离器的设置，每种图像类别采用不同的方法进行文本分离；对文本分离后的文本字符区域进行倾斜纠偏后处理，得到水平或者垂直的文本字符；将水平或垂直的文本字符进行修...

【专利技术属性】
技术研发人员：赵胜男，杜兴春，周倩竹，宋菲菲，王长征，
申请(专利权)人：同方知网北京技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人