用于搜索文本和以增强现实的方式显示发现的文本的系统和方法技术方案

技术编号:9909982 阅读:145 留言:0更新日期:2014-04-12 01:04
本发明专利技术提供了用于搜索一个或多个图像中的文本的系统和方法。计算设备执行的方法包括接收输入。计算设备根据输入来生成搜索参数,所述搜索参数包括所述文本。向该一个或多个图像应用光学字符识别,以生成计算机可读文本。应用搜索参数,以在计算机可读文本中搜索所述文本,以及如果发现所述文本,执行动作。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术提供了用于搜索一个或多个图像中的文本的系统和方法。计算设备执行的方法包括接收输入。计算设备根据输入来生成搜索参数,所述搜索参数包括所述文本。向该一个或多个图像应用光学字符识别,以生成计算机可读文本。应用搜索参数,以在计算机可读文本中搜索所述文本,以及如果发现所述文本,执行动作。【专利说明】
以下大致涉及搜索文本数据(例如,字母、词、数字等)。
技术介绍
可以通过例如书本、杂志、报纸、广告、传单等很多的媒体形式来印刷或显示文本。已知可以使用例如扫描仪的设备的来扫描文本。然而,扫描仪通常较大且笨重,并且不能容易地运送。因此,通常不方便随时扫描文本。【专利附图】【附图说明】参考附图,现在将仅通过示例的形式来描述实施例,其中:图1a是移动设备的示意图,该移动设备查看文本页、显示文本的图像并显示对与搜索参数相匹配的文本位于何处的指示。图1b是类似于图1a的示意图,在图1b中,移动设备正在查看另一文本页并显示对与搜索参数相匹配的另一文本位于何处的指示。图2是移动设备的示意图,该移动设备查看街道环境,识别道路名称,以及使用道路名称来确定移动设备的位置和导航方向。图3是示例移动设备和显示屏幕的平面图。图4是另一示例移动设备及其显示屏幕的平面图。图5是图3中不出的移动设备的背面及其相机设备的平面视图。图6是移动设备的示例实施例的框图。图7是移动设备显示的主屏幕的屏幕截图。图8是示意图6中示出的其他软件应用和组件中的示例软件应用和组件的框图。图9是用于执行与文本有关的增强现实操作的模块的示例配置的框图。图10是用于搜索文本和显示对在何处发现所寻找的文本的指示的示例计算机可执行指令的流程图。图11是用于显示覆盖文本图像的指示的示例计算机可执行指令的流程图。图12是用于记录页编号和在每页上发现的所寻找的文本的实例数目的示例计算机可执行指令的流程图。图13是用于对每页上所寻找的文本的实例的索引编排进行查看以及对包含所寻找的文本的图像进行选择的示例图形用户界面(GUI)。图14是用于识别页编号的示例计算机可执行指令的流程图。图15是用于识别页编号的示例计算机可执行指令的另一流程图。图16是用于搜索基于导航方向的道路名称的示例计算机可执行指令的流程图。图17是用于搜索基于移动设备的第一位置的道路名称的示例计算机可执行指令的流程图。图18是用于搜索图像中的文本的示例计算机可执行指令的流程图。【具体实施方式】应当理解的是,为了简要和清晰地进行说明,在适当的情况下,附图间的附图标记可能重复,以表明相应的或类似的元件。另外,阐述了大量特定的细节,以便提供对这里所描述的示例实施例的透彻理解。然而,本领域普通技术人员可以理解的是,没有这些特定的细节也可以实现这里所描述的实施例。在其他实例中,没有详细描述公知的方法、过程和组件,以免模糊这里所描述的示例实施例。而且,这些描述不应被视为对此处描述的示例实施例的保护范围的限制。要认识到,在物理文档中手动搜索文本是困难且耗时的。例如,一个人可以仔细阅读文档或书本中的很多页,以搜索特定词语的实例。如果存在着很多页(例如,数百页),该人将需要阅读每一页,以确定特定词语的实例出现在何处。该人可能开始匆忙地阅读或审阅文档或书本,并且可能在无意间没有注意到文本中特定词语的实例。当内容是不熟悉的或不吸引人的时,该人有可能更加不可能注意到特定词语的实例。在另一示例中,某人仅查找特定词语的实例,并且不愿意阅读被认为无关的其他文本,因为仅直接在特定词语周围的文本才被认为是相关的。这种情况会使得阅读文档或书本单调乏味,并且例如会使该人增加其文本审阅的速度。例如,这会直接或间接地导致该人在无意间没有注意到特定词语的实例增加。审阅文档并搜索特定词语的人还可能发现该任务对眼睛造成压力,特别是当文本是小尺寸字体时。在阅读难以阅读的字体风格的文本时,这也可能是困难的。这种情况会导致人的眼睛承受压力。还要意识到,当人行进通过街道时(例如,步行或驾车),该人可能被很多不同类型的标志(例如,道路标志、店面标志、公告板、广告等)分散注意力。该人可能没有看到或识别出其正在寻找的街道标志。如果某人开车很快或者将其视觉注意力集中在交通上,其可能也没有注意到街道标志。可以意识到的是,在查找特定街道标志时驾驶可能是困难的。当人可能在不熟悉的区域中驾车并因此不知道在哪儿发现街道标志时,问题更加复杂。此外,远处的街道标志可能难以阅读,因为对于人而言,文本可能显得很小或不清楚。本文中描述的本系统和方法解决了这些问题。转到图la,示出了打开到页202、204的书200。装备有相机的移动设备100正在相机的显示器110上实时地示出页202、204的图像。换言之,当移动设备100和书本200彼此相对移动时,显示器110上显示的图像自动更新,以示出相机当前正在捕捉的东西。在图1a中,相机正在查看页202,并且在显示器110上示出了图202的图像206。换言之,显示了页202上的文本的图像。显示器110还在其图形用户界面(⑶I)中包括了文本字段208,用户可以通过显示器110的⑶I和/或移动设备100的键盘或其他输入设备(图1a中未示出)来在文本字段208中输入搜索参数。换言之,如果某人正在书本200中查找文本的特定实例(例如,字母组合、词语、短语、等式、数字等),该人可以在文本字段208中输入要搜索的文本。例如,某人可能希望搜索术语“CusCO”208,其在图1a中示出为搜索参数。移动设备100使用光学字符识别(OCR)来从文本图像导出计算机可读文本,并使用该计算机可读文本来应用文本搜索算法,以发现搜索参数的实例。一旦发现,移动设备指示搜索参数位于何处。在示例中,使用围绕文本图像“Cusco”的框210来在显示器110上标识术语“Cusco”的位置。可以认识到,框210可以覆盖在图像206上。这增强了人通过移动设备100正在查看的现实。可以认识到,成像文本是图像,并且其含义不容易被计算设备或移动设备100所理解。相反,计算机可读文本包括计算设备或移动设备100理解的字符代码,并且可更加易于修改。可应用的字符编码和解码方案的非限制性示例包括ASCII码和Unicode。因此可以识别来自计算机可读文本的词语并将其与各种功能相关联。转向图lb,当某人将移动设备100从页202移动到页204时,将以相机正在查看或捕捉的当前图像来自动更新显示器110。可以认识到,可以通过实时的方式,几乎即刻地更新显示器Iio上正在显示的图像。换言之,当将相机放在页204的前面时,显示器110自动示出页204的图像212。当搜索参数“Cusco”仍在使用中时,移动设备100搜索术语“Cusco”。框210被示出为围绕术语“Cusco”,覆盖在页204上的文本的图像212上。可以认识到,其他用于在视觉上指示词语“Cusco”的位置的方法也是可应用的。可以认识到,这种系统和方法可有助于人快速地搜索文档或书本中的文本或者以硬拷贝格式显示的文本的其他实施例。例如,可以使用本文中的原理来搜索另一计算机屏幕上示出的特定词语。该人移动移动设备110来在文本页中扫描,并且在发现搜索参数时,在显示器110上突出显示其位置。这减少了该人的劳动量,因为不需要阅读每个词本文档来自技高网...

【技术保护点】
一种用于搜索至少一个图像中的文本的方法,所述方法由计算设备执行,所述方法包括:接收输入;根据所述输入来生成搜索参数,所述搜索参数包括所述文本;向所述至少一个图像应用光学字符识别,以生成计算机可读文本;应用所述搜索参数,以在所述计算机可读文本中搜索所述文本;以及如果发现所述文本,则执行动作。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:克里斯托弗·R·沃莫尔德康拉德·德尔伯特·西曼威廉·亚历山大·张
申请(专利权)人:黑莓有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1