基于移动装置的文本检测及跟踪制造方法及图纸

技术编号:11985323 阅读:95 留言:0更新日期:2015-09-02 15:05
所揭示实施例涉及基于移动装置的文本检测及跟踪。在一些实施例中,通过对通过摄像机俘获的图像帧执行光学字符辨识OCR以定位及辨识第一文本块而获得第一参考帧。可从一组后续图像帧中选择后续图像帧,所述选择是基于与所述选定后续图像相关联的参数,且可通过对所述选定后续图像帧执行OCR以辨识第二文本块而获得第二参考帧。基于所述第一文本块在所述第二参考帧中的位置及与所述第二参考帧相关联的姿态确定所述第一文本块与所述第二文本块之间的几何关系。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】基于移动装置的文本检测及跟踪相关申请案的交叉参考本申请案主张2013年9月9日申请的题为“基于移动装置的文本跟踪及检测(Mobile Device Based Text Tracking and Detect1n) ” 的第 14/021, 337 号美国申请案的权益及优先权,所述美国申请案又主张2013年I月4日申请的题为“基于移动装置的文本跟踪及检测(Mobile Device Based Text Tracking and Detect1n),,的第 61/749,248号美国临时申请案的权益及优先权,所述两个申请案以其全文引用的方式并入本文中。
本文揭示的标的物涉及文本检测及跟踪。
技术介绍
例如智能电话等移动装置越来越多地并有一或多个光学传感器,例如摄像机连同各种其它类型的传感器。移动装置上的摄像机常常能够拍摄静态图像与视频图像两者。然而,针对涉及文本的扫描的应用使用移动装置受到限制,这是因为具有许多挑战。某些挑战的实例包含由于用户手移动造成的运动模糊、由于摄像机相对于经扫描文本的定向的变化造成的透视图的失真,及移动装置光学子系统限制。举例来说,通过移动装置摄像机拍摄的视频图像相对于扫描仪来说可能具有低分辨率,且,另外,可能遭受运动模糊及透视图失真。促进进行迅速无缝文本检测及跟踪可通过实现可能能够利用文本检测及跟踪应用程序的输出的宽广范围的应用而增强移动装置的效用。因此,需要用以促进进行文本扫描、检测及/或辨识及/或跟踪的设备、系统及方法。
技术实现思路
在一个方面中,一种在移动站(MS)上的方法可包括:通过对通过所述MS上的摄像机俘获的图像帧执行光学字符辨识(OCR)以定位及辨识第一文本块而获得第一参考帧;从一组后续图像帧中选择后续图像帧,所述选择是基于与所述选定后续图像帧相关联的参数;通过对所述选定后续图像帧执行OCR以辨识第二文本块而获得第二参考帧;及至少部分基于所述第一文本块在所述第二参考帧中的位置及与所述第二参考帧相关联的摄像机姿态,确定所述第一文本块与所述第二文本块之间的几何关系。在另一方面中,一种MS可包括:摄像机,其经配置以俘获第一图像帧及一组后续图像帧;及处理器,其耦合到所述摄像机。所述处理器可包括:字词辨识模块,其经配置以:通过对所述第一图像帧执行光学字符辨识(OCR)以定位及辨识第一文本块而获得第一参考帧;从所述组后续图像帧中选择后续图像帧,所述选择是基于与所述选定后续图像帧相关联的参数;及通过对所述选定后续图像帧执行OCR以辨识第二文本块而获得第二参考帧。所述处理器可进一步包括文本汇编程序模块,其经配置以至少部分基于所述第一文本块在所述第二参考帧中的位置及与所述第二参考帧相关联的摄像机姿态,确定所述第一文本块与所述第二文本块之间的几何关系。在另一方面中,一种设备可包括:用于俘获一序列图像帧的成像装置;用于通过对所述序列图像帧中的图像帧执行光学字符辨识(OCR)以定位及辨识第一文本块而获得第一参考帧的装置;用于从所述序列图像帧中选择后续图像帧的装置,所述选择是基于与所述选定后续图像帧相关联的参数;用于通过对所述选定后续图像帧执行OCR以辨识第二文本块而获得第二参考帧的装置;以及用于至少部分基于所述第一文本块在所述第二参考帧中的位置及与所述第二参考帧相关联的所述成像装置的姿态,确定所述第一文本块与所述第二文本块之间的几何关系的装置。在另一方面中,一种非暂时性计算机可读媒体可包括指令,所述指令在由处理器执行时可执行在移动站(MS)上的方法,所述方法可包括:通过对通过所述MS上的摄像机俘获的图像帧执行光学字符辨识(OCR)以定位及辨识第一文本块而获得第一参考帧;从一组后续图像帧中选择后续图像帧,所述选择是基于与所述选定后续图像帧相关联的参数;通过对所述选定后续图像帧执行OCR以辨识第二文本块而获得第二参考帧;以及至少部分基于所述第一文本块在所述第二参考帧中的位置及与所述第二参考帧相关联的摄像机姿态,确定所述第一文本块与所述第二文本块之间的几何关系。所揭示实施例还涉及由处理器使用非暂时性计算机可读媒体或计算机可读存储器创建、存储、存取、读取或修改的软件、固件及程序指令。下文关于以下各图进一步解释这些及其它实施例。应理解,对于所属领域的技术人员来说,其它方面将从以下详细描述变得容易显而易见,其中借助于说明展示及描述各个方面。图式及详细描述应被视为本质上为说明性的而不是限制性的。【附图说明】图1展示能够执行文本跟踪及检测的实例MS的框图。图2展示摄像机相对于表面及坐标系上的字词的位置,所述位置可用以跟踪及/或维持文本块的位置。图3展示与所揭示实施例一致的进行文本检测及跟踪的实例方法的流程图。图4展示与所揭示实施例一致的用于进行文本跟踪的系统的实例架构。图5展示与所揭示实施例一致的可在移动站上执行的实例方法的流程图。【具体实施方式】将参看图式仅通过实例方式来描述本文揭示的实施例。下文结合附图阐述的详细描述希望作为对本专利技术的各个方面的描述,而不希望表示可在其中实践本专利技术的仅有方面。提供本专利技术中所描述的每一方面仅作为本专利技术的实例或说明,且不应必然地被解释为比其它方面优选或有利。详细描述包含用于提供对本专利技术的透彻理解的目的的特定细节。然而,所属领域的技术人员将显而易见,可在没有这些特定细节的情况下实践本专利技术。在一些情况下,以框图的形式展示众所周知的结构及装置以便避免混淆本专利技术的概念。首字母缩写词及其它描述性术语可仅出于便利及清晰性的目的而使用,且不希望限制本专利技术的范围。移动装置摄像机常常遭受限制其适用性的缺点。举例来说,低摄像机分辨率及其它光学子系统限制可限制移动装置摄像机在常规扫描及光学字符辨识(OCR)相关应用中的效用。在扫描过程期间由于用户手颤动造成的运动模糊及由于摄像机倾斜变化造成的透视图失真对在常规文本扫描及OCR应用中使用移动装置摄像机提出额外障碍。另外,为了确保扫描期间的较大的相对文本大小及准确的文本俘获,常常将摄像机握持为接近于文本,由此限制了可在单个图像或帧中俘获的字母或字词的数目。另外,因为常规OCR可招致显著计算开销,所以对于通过引入不可接受的延迟进行的许多应用来说,逐个帧地使用OCR可为效率低下的及不切实际的。本文揭示的包含设备、系统及方法的实施例促进进行高效连续文本扫描、跟踪及辨识。如本文所使用,术语“移动站(MS)”用以广泛地指包含以下各者的移动装置:蜂窝式电话、游戏装置、成像装置、移动电话或其它无线通信装置、个人通信系统(PCS)装置、个人导航装置(PND)、个人信息管理器(PM)、个人数字助理(PDA)、膝上型计算机等等。另外,“移动站”可省略通信元件及/或功能性。术语“移动站”还希望为可能并未经配置以连接到网络或另外与另一装置无线地或通过有线连接通信的装置。举例来说,本文描述的实施例可在独立装置中实施,例如游戏装置、手持型摄像机或可能并未经配置以连接到网络或另外与另一装置无线地或通过有线连接通信的另一装置。在一些实施例中,移动站可呈能够接收无线通信及/或导航信号及与其它装置通信的移动装置的形式,包含短程无线、红外线及/或有线连接。并且,“移动站”希望包含能够(例如)经由因特网、W1-Fi或另一网络与服务器通信的所有装置,包含无本文档来自技高网...

【技术保护点】
一种在移动站MS上的方法,所述方法包括:通过对通过所述MS上的摄像机俘获的图像帧执行光学字符辨识OCR以定位及辨识第一文本块而获得第一参考帧;从一组后续图像帧中选择后续图像帧,所述选择是基于与所述选定后续图像帧相关联的参数;通过对所述选定后续图像帧执行OCR以辨识第二文本块而获得第二参考帧;以及至少部分基于所述第一文本块在所述第二参考帧中的位置及与所述第二参考帧相关联的摄像机姿态,确定所述第一文本块与所述第二文本块之间的几何关系。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:迈克尔·盖尔沃茨杰优恩·金佩尔·O·尼尔森罗伊·劳伦斯·阿索克·伊妮果潘琪罗曼·塔罗尼优
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1