检测图像中所含文本的方法、装置和计算机可读记录介质制造方法及图纸

技术编号：15983170 阅读：45 留言：0更新日期：2017-08-12 05:46

本发明专利技术涉及检测图像中包含的文本的方法、装置和计算机可读记录介质。该方法包括：步骤a：在获得输入图像时，装置基于输入图像中包含的像素的特征值，在输入图像中检测至少一个候选文本，或对此进行协助；步骤b：装置基于在包含检测出的候选文本的区域内所选择的至少一个像素的特征值或该特征值的转换值，(i)将检测出的候选文本与第一阈值比较以将检测出的候选文本分类为强文本或非强文本，或对此进行协助，且(ii)将分类成非强文本的候选文本与第二阈值比较以将分类成非强文本的候选文本分类成弱文本或非文本，或对此进行协助；和步骤c：装置基于强文本和弱文本的相关信息，判断是否将弱文本分类为强文本，或是否对此进行协助。

全部详细技术资料下载

【技术实现步骤摘要】
检测图像中所含文本的方法、装置和计算机可读记录介质
本专利技术涉及检测图像中包含的文本的方法、装置和计算机可读记录介质，更具体地涉及包括如下步骤的方法、装置和计算机可读记录介质：在获得输入图像时，基于将所述输入图像中包含的像素的特征值，在所述输入图像中检测至少一个候选文本，或对此进行协助；基于在包含所检测出的候选文本的区域内所选择的至少一个像素的特征值或所述特征值的转换值，(i)将所检测出的候选文本与第一阈值比较以将所检测出的候选文本分类为强文本或非强文本，或对此进行协助，且(ii)将分类成所述非强文本的候选文本与第二阈值比较以将分类成所述非强文本的候选文本分类成弱文本或非文本，或对此进行协助；以及基于所述强文本和所述弱文本的相关信息，判断是否将所述弱文本分类为所述强文本，或对此进行协助。
技术介绍
图像内的文本经常提供有意义的信息，因此认为在诸如图像和视频检索(imageandvideoretrieval)、多语言翻译、汽车援助(automotiveassistance)等各种计算机视觉应用中检测并识别场景文本(SceneText)是重要的。场景文本检测算法为用于在图像中检测文本(字符)的算法，根据候选文本提取方法大致可分为滑动窗口(slidingwindow)方式和连通域分析(connectedcomponentanalysis)方式。滑动窗口方式为在图像的所有位置中多尺度移动窗口以检测场景图像的文本的技术。该技术具有彻底地搜索输入图像因此表示检测了多少文本区域的查全率(recallrate)高的优点。然而，由于彻底的窗口扫描而不可避免地造成大量的计算...
检测图像中所含文本的方法、装置和计算机可读记录介质

【技术保护点】
一种检测图像中包含的文本的方法，包括：步骤a：装置在获得输入图像时，基于所述输入图像中包含的像素的特征值，在所述输入图像中检测至少一个候选文本，或对此进行协助；步骤b：所述装置基于在包含所检测出的候选文本的区域内所选择的至少一个像素的特征值或所述特征值的转换值，将所检测出的候选文本与第一阈值比较以将所检测出的候选文本分类为强文本或非强文本，或对此进行协助，且将分类成所述非强文本的候选文本与第二阈值比较以将分类成所述非强文本的候选文本分类成弱文本或非文本，或对此进行协助；以及步骤c：所述装置基于所述强文本和所述弱文本的相关信息，判断是否将所述弱文本分类为所述强文本，或是否对此进行协助。

【技术特征摘要】
2016.02.03 US 15/014,4411.一种检测图像中包含的文本的方法，包括：步骤a：装置在获得输入图像时，基于所述输入图像中包含的像素的特征值，在所述输入图像中检测至少一个候选文本，或对此进行协助；步骤b：所述装置基于在包含所检测出的候选文本的区域内所选择的至少一个像素的特征值或所述特征值的转换值，将所检测出的候选文本与第一阈值比较以将所检测出的候选文本分类为强文本或非强文本，或对此进行协助，且将分类成所述非强文本的候选文本与第二阈值比较以将分类成所述非强文本的候选文本分类成弱文本或非文本，或对此进行协助；以及步骤c：所述装置基于所述强文本和所述弱文本的相关信息，判断是否将所述弱文本分类为所述强文本，或是否对此进行协助。2.根据权利要求1所述的方法，其特征在于，在所述步骤c中，所述装置基于所述强文本和所述弱文本的相关信息，将所述弱文本分类为所述强文本或非文本，或对此进行协助。3.根据权利要求1所述的方法，其特征在于，在所检测出的候选文本为多个时，在所述步骤a后，还包括步骤a1：所述装置识别包括包含所检测出的多个候选文本的区域以预定比率以上彼此重叠的候选文本的至少一个候选文本组且针对所识别的各候选文本组选择满足预定条件的候选文本，或对此进行协助，其中，在所述步骤b中，基于在包含满足所述预定条件的候选文本的区域中所选择的至少一个像素的特征值或所述特征值的转换值，将满足所述预定条件的候选文本与所述第一阈值比较以将满足所述预定条件的候选文本分类为所述强文本或所述非强文本，或对此进行协助，且将分类为所述非强文本的候选文本与所述第二阈值比较以将分类为所述非强文本的候选文本分类为所述弱文本或所述非文本，或对此进行协助。4.根据权利要求1所述的方法，其特征在于，在所述步骤a中，当所述输入图像的预定区域中所包含的所有像素的特征值大于或小于所述预定区域的外部边界区域的特征值时，所述装置将所述预定区域检测为一个候选文本，或对此进行协助。5.根据权利要求4所述的方法，其特征在于，所述装置改变所述预定区域的像素强度水平以检测所述至少一个候选文本，或对此进行协助，在所检测出的所述至少一个候选文本中，所述装置将所述预定区域的像素强度水平相对大的低等级候选文本中所述预定区域的像素强度水平最大的候选文本以及包含所述低等级候选文本的区域且所述预定区域的像素强度水平相对小的高等级候选文本中所述预定区域的像素强度水平最大的候选文本分别分配至子节点和母节点以配置树，或对此进行协助。6.根据权利要求5所述的方法，其特征在于，针对所述树中的特定节点，当包含与所述特定节点对应的候选文本的区域以及包含与祖先节点对应的候选文本的区域以预定比率以上重叠的情况出现预定次数以上时，所述装置选择与包含候选文本的区域相比于自身的特定祖先节点的变化量相对最小的节点相对应的候选文本，或对此进行协助，其中，所述与祖先节点对应的候选文本包含与所述特定节点对应的候选文本的区域且所述预定区域的像素强度水平相对小，在所述步骤b中，基于在包含所选择的候选文本的区域内所选择的至少一个像素的特征值或所述特征值的转换值，将满足所述预定条件的候选文本与所述第一阈值比较以将满足所述预定条件的候选文本分类为所述强文本或所述非强文本，或对此进行协助，且将分类为所述非强文本的候选文本与所述第二阈值比较以将分类为所述非强文本的候选文本分类为所述弱文本或所述非文本，或对此进行协助。7.根据权利要求1所述的方法，还包括：步骤d：所述装置将通过与所述第一阈值比较而分类的强文本和从所述弱文本编入的强文本归组，或对此进行协助。8.根据权利要求7所述的方法，其特征在于，当将第一强文本和从第一弱文本编入的第二强文本归组，且基于所述第二强文本和第二弱文本的相关信息，将所述第二弱文本分类为第三强文本时，所述装置将所述第三强文本与所述第一强文本和所述第二强文本归组在一起，或对此进行协助。9.根据权利要求1所述的方法，其特征在于，在所述步骤b中，当在所述第一阈值和所述第二阈值之间存在至少一个中间阈值时，将分类成所述非强文本的候选文本与所述中间阈值进行比较以将分类成所述非强文本的候选文本分类为所述强文本或次弱文本，或对此进行协助，且将所述次弱文本与所述第二阈值进行比较以将所述次弱文本分类为所述弱文本或所述非文本，或对此进行协助。10.根据权利要求1所述的方法，其特征在于，在所述步骤b中，所述装置基于在包含所检测出的候选文本的区域内所选择的像素的特征值的平均局部二进制模式转换值，将所检测出的候选文本与第一阈值比较以将所检测出的候选文本分类为强文本或非强文本，或对此进行协助，且将分类成所述非强文本的候选文本与第二阈值比较以将分类成所述非强文本的候选文本分类成弱文本或非文本，或对此进行协助。11.根据权利要求1所述的方法，其特征在于，在所述步骤b中，所述装置使用由AdaBoost算法所训练的分类器对所检测出的候选文本进行分类，或对此进行协助。12.根据权利要求1所述的方法，其特征在于，在所述步骤c中，所述相关信息包括所述强文本和所述弱文本的位置信息、大小信息、颜色信息、笔画宽度信息中的至少一部分。13.根据权利要求1所述的方法，其特征在于，包含所检测出的候选文本的区域是额外的空白区域被最小化且包含所检测出的候选文本的边界框区域。14.一种用...

【专利技术属性】
技术研发人员：赵浩辰，
申请(专利权)人：斯特拉德视觉公司，
类型：发明
国别省市：韩国,KR

全部详细技术资料下载我是这个专利的主人