【技术实现步骤摘要】
【国外来华专利技术】用于有助于检测图像内的文本的方法和装置
本专利技术的实施例总体涉及图像处理技术并且更具体地涉及用于有助于检测图像内的文本的方法和装置。
技术介绍
现代计算时代已经带来计算能力的迅速扩张从而产生可负担并且强大的计算设备的发展。现代计算设备的使用已经变得在跨社会经济背景范畴的消费者之中几乎无处不在。这些现代计算设备可以能够执行多种基于图像的服务、例如包括增强现实应用、兴趣点导航服务和/或其它应用,在这些其它应用中,可以捕获用户的周围环境的图像并且用可以通过处理图像而获得的附加情境信息扩充图像。作为又一示例,三维地图绘制技术可以使用捕获的现实图像以产生三维地图,这些三维地图包括可以从图像情境获得的与兴趣点有关的三维定位信息和内容。这样的基于图像的服务可以依赖于检测捕获的现实图像内的文本和/或通过该检测来增强。就此而言,在现实图像内识别的文本可以用来有助于兴趣点识别、提供捕获的文本的音频回读、为异国旅行者提供语言翻译服务等。然而图像内的文本检测仍然成问题。就此而言,尽管已经在文档识别领域内使用图像中的文本检测,但是在自然界图像(比如室外场景中的文本检测)已经证实由于如下挑战而明显更困难,这些挑战由于大量文本字体和样式、相机视点、图像对比度以及其它因素而产生,这些其它因素影响捕获的自然界图像内的文本的可视性。另外,尽管文档文本在文档识别领域中可以是在捕获的图像内的主要焦点,但是在自然界图像内的文本覆盖范围通常是图像的很小部分(经常在数十兆像素的图像中占用数百像素)。
技术实现思路
这里提供用于有助于在图像内的文本检测的方法、装置和计算机程序产品。根据各种实施例的方法、装 ...
【技术保护点】
一种方法,包括:计算与包含假设的文本片段的图像区域关联的阿尔法值,所述阿尔法值被定义为用于所述假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数;至少部分地基于针对所述假设的文本片段确定的间隔长度分布计算伽马值;以及至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类。
【技术特征摘要】
【国外来华专利技术】2011.11.21 US 13/300,9721.一种用于处理图像的方法,包括:计算与包含假设的文本片段的图像区域关联的阿尔法值,所述阿尔法值被定义为用于所述假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数;至少部分地基于针对所述假设的文本片段确定的间隔长度分布计算伽马值;以及至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类。2.根据权利要求1所述的方法,其中计算所述阿尔法值包括在不直接计算用于所述假设的文本片段的所述弯曲字符长度分布、所述字符宽度分布或者所述字符间间距分布的情况下计算所述阿尔法值。3.根据权利要求2所述的方法,其中计算所述阿尔法值包括至少部分地基于占用比和用于所述假设的文本片段的笔画宽度计算所述阿尔法值,所述占用比定义确定的所述图像区域中被所述假设的文本片段占用的面积与确定的所述图像区域的总面积之比。4.根据权利要求2所述的方法,其中计算所述阿尔法值包括至少部分地基于确定的所述图像区域的总面积和穿过所述假设的文本片段的至少一个假设的字符的、以线间间距为特征的多个基本平行线的交点数目来计算所述阿尔法值。5.根据权利要求1所述的方法,其中至少部分地基于所述间隔长度分布计算所述伽马值包括计算被文本高度除得的所述间隔长度的分布的均值与被文本高度除得的所述间隔长度的所述分布的标准偏差之比。6.根据权利要求1所述的方法,还包括:跨所述假设的文本片段应用至少一个扫描线;至少部分地基于所应用的至少一个扫描线确定所述假设的文本片段的至少一个性质;以及其中计算所述阿尔法值和所述伽马值包括至少部分地基于所确定的所述假设的文本片段的至少一个性质计算所述阿尔法值和所述伽马值。7.根据权利要求1所述的方法,还包括:通过二值化确定的所述图像区域来得出二值图像;至少部分地基于所述二值图像确定所述图像区域是否使用仅两个概率分布可描述;仅在其中确定所述图像区域使用仅两个概率分布可描述的实例中,使用所述二值图像来计算所述阿尔法值并且计算所述伽马值;以及在其中所述图像区域使用仅两个概率分布不可描述的实例中,将所述图像区域分类为非包含文本的区域。8.根据权利要求1所述的方法,其中至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类包括:确定计算出的所述阿尔法值和所述伽马值是否满足所定义的、与期望的阿尔法值和伽马值的阈值关系;在其中确定计算出的所述阿尔法值和所述伽马值满足与期望的阿尔法值和伽马值的所述阈值关系的实例中,将所述图像区域分类为包含文本的区域;以及在其中确定计算出的所述阿尔法值和所述伽马值不满足与期望的阿尔法值和伽马值的所述阈值关系的实例中,将所述图像区域分类为非包含文本的区域。9.根据权利要求1至8中任一项所述的方法,其中至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类包括:应用高斯分布函数;在其中计算出的所述阿尔法值和所述伽马值满足与所述高斯分布函数的阈值关系的实例中,将所述图像区域分类为包含文本的区域;以及在其中计算出的所述阿尔法值和所述伽马值不满足与所述高斯分布函数的阈值关系的实例中,将所述图像区域分类为非包含文本的区域。10.一种用于处理图像的装置,包括至少一个处理器和存储计算机程序代码的至少一个存储器,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置至少:计算与包含假设的文本片段的图像区域关联的阿尔法值,所述阿尔法值被定义为用于所述假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数;至少部分地基于针对所述假设的文本片段确定的间隔长度分布计算伽马值;并且至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类。11.根据权利要求10所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置在不直接计算用于所述假设的文本片段的所述弯曲字符长度分布、所述字符宽度分布或者所述字符间间距分布的情况下计算所述阿尔法值。12.根据权利要求11所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置至少部分地基于占用比和用于所述假设的文本片段的笔画宽度计算所述阿尔法值,所述占用比定义确定的所述图像区域中被所述假设的文本片段占用的面积与确定的所述图像区域的总面积之比。13.根据权利要求11所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置至少部分地基于确定的所述图像区域的总面积和穿过所述假设的文本片段的至少一个假设的字符的、以线间间距为特征的多个基本平行线的交点数目来计算所述阿尔法值。14.根据权利要求10所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置至少部分地通过计算被文本高度除得的所述间隔长度的分布的均值与被文本高度除得的所述间隔长度的所述分布的标准偏差之比来至少部分地基于所述间隔长度分布计算所述伽马值。15.根据权利要求10所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起还使所述装置:跨所述假设的文本片段应用至少一个扫描线;至少部分地基于所应用的至少一个扫描线确定所述假设的文本片段的至少一个性质;并且至少部分地通过至少部分地基于所确定的所述假设的文本片段的至少一个性质计算所述阿尔法值和所述伽马值来计算所述阿尔法值和所述伽马值。16.根据权利要求10所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起还使所述装置:通...
【专利技术属性】
技术研发人员:V·帕拉梅斯瓦兰,SH·特赛,R·格泽茨克祖克,
申请(专利权)人:诺基亚公司,
类型:发明
国别省市:芬兰;FI
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。