当前位置: 首页 > 专利查询>诺基亚公司专利>正文

用于有助于检测图像内的文本的方法和装置制造方法及图纸

技术编号:10258767 阅读:156 留言:0更新日期:2014-07-25 16:26
提供用于有助于检测图像内的文本的方法和装置。一种方法可以包括计算与包含假设的文本片段的图像区域关联的阿尔法值。可以定义阿尔法值为用于假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数。该方法还可以包括至少部分地基于针对假设的文本片段确定的间隔长度分布计算伽马值。该方法也可以包括至少部分地基于计算出的阿尔法值和伽马值对图像区域是否为包含文本的区域进行分类。也提供了对应的装置。

【技术实现步骤摘要】
【国外来华专利技术】用于有助于检测图像内的文本的方法和装置
本专利技术的实施例总体涉及图像处理技术并且更具体地涉及用于有助于检测图像内的文本的方法和装置。
技术介绍
现代计算时代已经带来计算能力的迅速扩张从而产生可负担并且强大的计算设备的发展。现代计算设备的使用已经变得在跨社会经济背景范畴的消费者之中几乎无处不在。这些现代计算设备可以能够执行多种基于图像的服务、例如包括增强现实应用、兴趣点导航服务和/或其它应用,在这些其它应用中,可以捕获用户的周围环境的图像并且用可以通过处理图像而获得的附加情境信息扩充图像。作为又一示例,三维地图绘制技术可以使用捕获的现实图像以产生三维地图,这些三维地图包括可以从图像情境获得的与兴趣点有关的三维定位信息和内容。这样的基于图像的服务可以依赖于检测捕获的现实图像内的文本和/或通过该检测来增强。就此而言,在现实图像内识别的文本可以用来有助于兴趣点识别、提供捕获的文本的音频回读、为异国旅行者提供语言翻译服务等。然而图像内的文本检测仍然成问题。就此而言,尽管已经在文档识别领域内使用图像中的文本检测,但是在自然界图像(比如室外场景中的文本检测)已经证实由于如下挑战而明显更困难,这些挑战由于大量文本字体和样式、相机视点、图像对比度以及其它因素而产生,这些其它因素影响捕获的自然界图像内的文本的可视性。另外,尽管文档文本在文档识别领域中可以是在捕获的图像内的主要焦点,但是在自然界图像内的文本覆盖范围通常是图像的很小部分(经常在数十兆像素的图像中占用数百像素)。
技术实现思路
这里提供用于有助于在图像内的文本检测的方法、装置和计算机程序产品。根据各种实施例的方法、装置和计算机程序产品可以向计算设备、计算设备用户和设备服务提供商提供若干优点。更具体而言,一些示例实施例提供检测图像中的文本,这可以特别有益于检测在自然界图像(比如室外图像)内的文本,在该自然界图像中可能存在多种字体样式和大小,并且在该自然界图像中,背景对比度可能另外妨碍文本检测。就此而言,一些示例实施例提供在自然界图像内独立于文本的字体、字母样式、语言和定向的文本检测。更具体而言,一些示例实施例利用可以独立于字体、字母样式和语言的文本性质,这些性质可以通过使用可以基于理解的文本性质的模型而更迅速执行的计算来提供比先前方法更快的文本检测。另外,一些示例实施例所提供的基于模型的文本检测方式可以比先前基于试探的方式更可靠。一些示例实施例还提供用于为文本检测指定性能界限的能力,从而可以根据可以由文本模型定义的已知文本性质来提供某个检测率、由此使用户能够调节文本检测以满足希望的性能界限。在第一示例实施例中,提供一种方法,该方法可以包括计算与包含假设的文本片段的图像区域关联的阿尔法值。阿尔法值可以被定义为用于假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数。这一示例实施例的方法还可以包括至少部分地基于针对假设的文本片段确定的间隔长度分布计算伽马值。这一示例实施例的方法也可以包括至少部分地基于计算出的阿尔法值和伽马值对图像区域是否为包含文本的区域进行分类。在另一示例实施例中,提供了一种装置。这一示例实施例的装置可以包括至少一个处理器和存储计算机程序代码的至少一个存储器。至少一个存储器和存储的计算机程序代码可以被配置为与至少一个处理器一起使这一示例实施例的装置至少计算与包含假设的文本片段的图像区域关联的阿尔法值。阿尔法值可以被定义为用于假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数。至少一个存储器和存储的计算机程序代码可以被配置为与至少一个处理器一起还使这一示例实施例的装置至少部分地基于针对假设的文本片段确定的间隔长度分布计算伽马值。至少一个存储器和存储的计算机程序代码可以被配置为与至少一个处理器一起还使这一示例实施例的装置至少部分地基于计算出的阿尔法值和伽马值对图像区域是否为包含文本的区域进行分类。在另一示例实施例中,提供了一种计算机程序产品。这一实施例的计算机程序产品包括至少一个计算机可读存储介质,至少一个计算机可读存储介质具有在其中存储的计算机可读程序指令。这一示例实施例的程序指令可以包括被配置为计算与包含假设的文本片段的图像区域关联的阿尔法值的程序指令。阿尔法值可以被定义为用于假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数。这一示例实施例的程序指令还可以包括被配置为至少部分地基于针对假设的文本片段确定的间隔长度分布计算伽马值的程序指令。这一示例实施例的程序指令可以包括被配置为至少部分地基于计算出的阿尔法值和伽马值对图像区域是否为包含文本的区域进行分类的程序指令。在更多另一示例实施例中,提供了一种装置,该装置可以包括用于计算与包含假设的文本片段的图像区域关联的阿尔法值的装置。阿尔法值可以被定义为用于假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数。这一示例实施例的装置还可以包括用于至少部分地基于针对假设的文本片段确定的间隔长度分布计算伽马值的装置。这一示例实施例的装置也可以包括用于至少部分地基于计算出的阿尔法值和伽马值对图像区域是否为包含文本的区域进行分类的装置。提供以上
技术实现思路
仅用于概括本专利技术的一些示例实施例以便提供对本专利技术的一些方面的基本理解。因而将认识到以上描述的示例实施例仅为示例而不应解释为以任何方式缩小本专利技术的范围或者精神实质。将认识到本专利技术的范围除了这里概括的实施例之外还涵盖许多潜在实施例,以下将进一步描述这些潜在实施例中的一些潜在实施例。附图说明已经这样用一般措词描述本专利技术的一些示例实施例,现在将参照附图,这些附图未必按比例绘制,并且在这些附图中:图1图示根据一些示例实施例的用于有助于检测图像内的文本的文本检测装置的框图;图2是根据一些示例实施例的移动终端的示意框图;图3图示根据一些示例实施例的用于执行文本检测的系统;图4图示根据一些示例实施例的用于单词生成的示例贝叶斯网络,该贝叶斯网络可以用来描述对在捕获的图像内的文本的影响变量和效果;图5图示根据一些示例实施例跨假设的文本片段应用扫描线;图6图示根据一些示例实施例的针对训练数据集计算的阿尔法值和伽马值,可以使用这些阿尔法值和伽马值作为用于对假设的文本片段进行分类的模型;图7图示用于阿尔法值和伽马值的示例散点图;图8图示根据一些示例实施例的样本分类结果;图9图示根据一些示例实施例的有助于检测图像内的文本的示例方法的流程图;并且图10图示根据一些示例实施例的有助于检测图像内的文本的另一示例方法的流程图。具体实施方式现在下文将参照附图更完全地描述本专利技术的一些实施例,在附图中示出本专利技术的一些、但是并非所有实施例。实际上,本专利技术可以用许多不同形式来体现而不应解释为限于这里阐述的实施例;实际上,提供这些实施例使得本公开内容将满足适用法律要求。相似标号全篇指代相似单元。如这里所用,术语“数据”、“内容”、“信息”和相似术语可以根据各种示例实施例可互换地用来指代能够传输、接收、显示和/或存储的数据。因此,使用任何这样的术语不应解释为限制公开内容的精神实质和范围。另外,在这里描述计算设备从另一计算设备接收数据时,将认识到可以从另一计算设备直接接收数据或者可以经由一个或者多个中间计算设备(如比如一个或者多个服务器、中继、本文档来自技高网
...
用于有助于检测图像内的文本的方法和装置

【技术保护点】
一种方法,包括:计算与包含假设的文本片段的图像区域关联的阿尔法值,所述阿尔法值被定义为用于所述假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数;至少部分地基于针对所述假设的文本片段确定的间隔长度分布计算伽马值;以及至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类。

【技术特征摘要】
【国外来华专利技术】2011.11.21 US 13/300,9721.一种用于处理图像的方法,包括:计算与包含假设的文本片段的图像区域关联的阿尔法值,所述阿尔法值被定义为用于所述假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数;至少部分地基于针对所述假设的文本片段确定的间隔长度分布计算伽马值;以及至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类。2.根据权利要求1所述的方法,其中计算所述阿尔法值包括在不直接计算用于所述假设的文本片段的所述弯曲字符长度分布、所述字符宽度分布或者所述字符间间距分布的情况下计算所述阿尔法值。3.根据权利要求2所述的方法,其中计算所述阿尔法值包括至少部分地基于占用比和用于所述假设的文本片段的笔画宽度计算所述阿尔法值,所述占用比定义确定的所述图像区域中被所述假设的文本片段占用的面积与确定的所述图像区域的总面积之比。4.根据权利要求2所述的方法,其中计算所述阿尔法值包括至少部分地基于确定的所述图像区域的总面积和穿过所述假设的文本片段的至少一个假设的字符的、以线间间距为特征的多个基本平行线的交点数目来计算所述阿尔法值。5.根据权利要求1所述的方法,其中至少部分地基于所述间隔长度分布计算所述伽马值包括计算被文本高度除得的所述间隔长度的分布的均值与被文本高度除得的所述间隔长度的所述分布的标准偏差之比。6.根据权利要求1所述的方法,还包括:跨所述假设的文本片段应用至少一个扫描线;至少部分地基于所应用的至少一个扫描线确定所述假设的文本片段的至少一个性质;以及其中计算所述阿尔法值和所述伽马值包括至少部分地基于所确定的所述假设的文本片段的至少一个性质计算所述阿尔法值和所述伽马值。7.根据权利要求1所述的方法,还包括:通过二值化确定的所述图像区域来得出二值图像;至少部分地基于所述二值图像确定所述图像区域是否使用仅两个概率分布可描述;仅在其中确定所述图像区域使用仅两个概率分布可描述的实例中,使用所述二值图像来计算所述阿尔法值并且计算所述伽马值;以及在其中所述图像区域使用仅两个概率分布不可描述的实例中,将所述图像区域分类为非包含文本的区域。8.根据权利要求1所述的方法,其中至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类包括:确定计算出的所述阿尔法值和所述伽马值是否满足所定义的、与期望的阿尔法值和伽马值的阈值关系;在其中确定计算出的所述阿尔法值和所述伽马值满足与期望的阿尔法值和伽马值的所述阈值关系的实例中,将所述图像区域分类为包含文本的区域;以及在其中确定计算出的所述阿尔法值和所述伽马值不满足与期望的阿尔法值和伽马值的所述阈值关系的实例中,将所述图像区域分类为非包含文本的区域。9.根据权利要求1至8中任一项所述的方法,其中至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类包括:应用高斯分布函数;在其中计算出的所述阿尔法值和所述伽马值满足与所述高斯分布函数的阈值关系的实例中,将所述图像区域分类为包含文本的区域;以及在其中计算出的所述阿尔法值和所述伽马值不满足与所述高斯分布函数的阈值关系的实例中,将所述图像区域分类为非包含文本的区域。10.一种用于处理图像的装置,包括至少一个处理器和存储计算机程序代码的至少一个存储器,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置至少:计算与包含假设的文本片段的图像区域关联的阿尔法值,所述阿尔法值被定义为用于所述假设的文本片段的弯曲字符长度分布、字符宽度分布和字符间间距分布的函数;至少部分地基于针对所述假设的文本片段确定的间隔长度分布计算伽马值;并且至少部分地基于计算出的所述阿尔法值和所述伽马值对所述图像区域是否为包含文本的区域进行分类。11.根据权利要求10所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置在不直接计算用于所述假设的文本片段的所述弯曲字符长度分布、所述字符宽度分布或者所述字符间间距分布的情况下计算所述阿尔法值。12.根据权利要求11所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置至少部分地基于占用比和用于所述假设的文本片段的笔画宽度计算所述阿尔法值,所述占用比定义确定的所述图像区域中被所述假设的文本片段占用的面积与确定的所述图像区域的总面积之比。13.根据权利要求11所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置至少部分地基于确定的所述图像区域的总面积和穿过所述假设的文本片段的至少一个假设的字符的、以线间间距为特征的多个基本平行线的交点数目来计算所述阿尔法值。14.根据权利要求10所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起使所述装置至少部分地通过计算被文本高度除得的所述间隔长度的分布的均值与被文本高度除得的所述间隔长度的所述分布的标准偏差之比来至少部分地基于所述间隔长度分布计算所述伽马值。15.根据权利要求10所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起还使所述装置:跨所述假设的文本片段应用至少一个扫描线;至少部分地基于所应用的至少一个扫描线确定所述假设的文本片段的至少一个性质;并且至少部分地通过至少部分地基于所确定的所述假设的文本片段的至少一个性质计算所述阿尔法值和所述伽马值来计算所述阿尔法值和所述伽马值。16.根据权利要求10所述的装置,其中所述至少一个存储器和存储的计算机程序代码被配置为与所述至少一个处理器一起还使所述装置:通...

【专利技术属性】
技术研发人员:V·帕拉梅斯瓦兰SH·特赛R·格泽茨克祖克
申请(专利权)人:诺基亚公司
类型:发明
国别省市:芬兰;FI

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1