光学字符辨识(OCR)高速缓冲存储器更新制造技术

技术编号：10548540 阅读：188 留言：0更新日期：2014-10-16 15:45

本文中所描述的技术提供一种用于自动地及智能地创建及更新OCR高速缓冲存储器同时使用计算装置执行OCR的方法。可将使用耦合到所述计算装置的相机俘获的图像与存储于所述OCR高速缓冲存储器中的现有图像进行匹配。如果发现匹配，那么可用利用新图像的新或较佳信息来更新所述OCR高速缓冲存储器。所述匹配的现有图像可保留在所述OCR高速缓冲存储器中，或新俘获的图像可替换所述OCR高速缓冲存储器中的所述匹配的现有图像。在一个实施例中，描述了用以在将所述图像存储于所述OCR高速缓冲存储器中之前移除或减少眩光的技术。在一些实施例中，在不执行OCR的情况下移除或减少眩光。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】光学字符辨识(OCR)高速缓冲存储器更新
技术介绍
光学字符辨识(OCR)为手写的、用打字机打出的或印刷的文本、图形或符号到机器编码的文本的机械或电子转译。OCR为计算机视觉及扩增实境应用中的正在发展的研究领域。计算机视觉允许装置感知其附近的环境。计算机视觉通过允许来自终端用户与真实世界的互动的感测输入扩展到虚拟世界中而实现扩增实境中的应用。在真实生活实例应用中，具备计算机视觉能力的OCR可帮助视觉残障人士感知例如智能电话等个人移动装置的相机的视野中的书面文本及符号。
技术实现思路
本文中所描述的技术提供一种用于在扩增实境的应用中自动地及智能地创建及/或更新OCR高速缓冲存储器同时使用移动装置执行OCR的方法。使用耦合到所述移动装置的相机俘获的图像与存储于所述OCR高速缓冲存储器中的现有图像进行匹配。如果发现匹配，那么用利用新图像的新及/或较佳信息来更新所述OCR高速缓冲存储器，而不是将所述新图像作为单独条目存储于所述OCR高速缓冲存储器中。或者，所述新图像可替换所述OCR高速缓冲存储器中的所述现有图像。另外，描述了用以使用多个图像从图像移除眩光的技术。举例来说，来自图像的区的眩光可通过使用来自相同场景的不具有与关键图像相同的区的眩光的另一图像的信息来移除。在一个实施例中，可甚至在无OCR的情况下从图像减少或移除眩光。在一个实施例中，可组合地执行眩光减少及OCR高速缓存。智能及自动OCR高速缓冲存储器更新对用户来说是有利的，因为其允许用户存取与相同场景相关联的所有信息及/或可允许用户存取与多个场景相关联的信息。此外，在随着时间的过去与相同场景的多个图像之间的图像信息...
光学字符辨识(OCR)高速缓冲存储器更新

【技术保护点】
一种方法，其包括：接收多个图像；辨识所述多个图像中的每一者中的数据，其中辨识所述多个图像中的每一者中的数据包括对所述多个图像执行光学字符辨识；至少部分基于所述辨识的数据确定所述多个图像中的至少两个图像包括来自第一场景的信息；及使用所述至少两个图像中的至少一个图像及与所述至少一个图像相关联的所述辨识的数据来存储表示所述第一场景的最终图像。

【技术特征摘要】
【国外来华专利技术】2012.01.09 US 61/584,765;2013.01.08 US 13/736,5271.一种用于执行光学字符辨识的方法，其包括：接收多个图像；辨识所述多个图像中的每一者中的数据，其中辨识所述多个图像中的每一者中的数据包括对所述多个图像执行光学字符辨识；至少部分基于所述辨识的数据确定所述多个图像中的至少两个图像包括来自第一场景的信息；基于每一图像中辨识的数个图形对象及用于所述数个图形对象中的每一者的辨识的置信度计算所述至少两个图像的每一者的能量；使用所述至少两个图像中的至少一个图像及与所述至少一个图像相关联的所述辨识的数据来存储表示所述第一场景的最终图像，其中所述至少一个图像包括关键图像，所述关键图像通过比较与所述至少两个图像的每一图像相关联的能量而被选择。2.根据权利要求1所述的方法，其中所述接收包括使用相机连续俘获所述多个图像。3.根据权利要求1所述的方法，其中维持所述多个图像中的所述至少一个图像及所述至少一个图像的所述辨识的数据的存储，同时俘获后面的图像且在所述后面的图像中辨识数据。4.根据权利要求1所述的方法，其中在存储所述最终图像之前，所述方法进一步包括使用所述至少两个图像及与所述至少两个图像相关联的所述辨识的数据来合成所述最终图像，其中所述存储包括存储所述合成的图像。5.根据权利要求4所述的方法，其中所述合成包括将来自所述至少两个图像中的第二图像的元素并入到所述至少一个图像中以创建所述最终图像。6.根据权利要求4所述的方法，其中所述最终图像包括所述至少一个图像，其中所述合成包括将所述至少两个图像中的第二图像的所述辨识的数据并入到所述至少一个图像的所述辨识的数据中。7.根据权利要求1所述的方法，其中所述确定包括比较所述至少两个图像中的每一者中的图形对象值、图形对象颜色、背景颜色及前景颜色中的一或多者。8.根据权利要求1所述的方法，其进一步包括确定所述多个图像中的一或多个图像包括来自除了所述第一场景之外的一或多个场景的信息，及显示所述最终图像及分别表示所述一或多个场景的一或多个图像，或显示所述至少一个图像及所述一或多个场景的所述辨识的数据。9.根据权利要求8所述的方法，其进一步包括确定用户选择了显示的图像中的一者或所述一个图像的所显示的辨识的数据，及将与选择的图像或辨识的数据相关的信息输入到程序中。10.根据权利要求1所述的方法，其中在存储所述最终图像之前，所述方法进一步包括：从来自所述第一场景的两个或两个以上图像的第一图像中识别具有眩光的第一区；从来自所述第一场景的所述两个或两个以上图像的第二图像中识别不具有眩光的第二区，其中所述第一区及所述第二区表示所述第一场景的相同区；及使用所述第一图像及来自所述第二图像的不具有眩光的所述第二区合成具有减少的眩光的所述最终图像。11.一种移动装置，其包括：一个或多个处理器；一个或多个计算机可读存储装置，其耦合到所述一个或多个处理器；存储在所述一个或多个计算机可读存储装置中且经配置以被所述一个或多个处理器执行的多个模块，所述多个模块包括：图像模块，其经配置以接收多个图像；OCR引擎，其经配置以使用光学字符辨识来辨识所述多个图像中的每一者中的数据；匹配模块，其经配置以至少部分基于所述辨识的数据确定所述多个图像中的至少两个图像包括来自第一场景的信息；选择模块，其经配置以从所述至少两个图像中选择至少一个图像，其中选择所述至少一个图像包括基于每一图像中辨识的数个图形对象及用于所述数个图形对象中的每一者的辨识的置信度计算所述至少两个图像的每一者的能量；及集成模块，其经配置以使用所述至少两个图像中的至少一个图像及与所述至少一个图像相关联的所述辨识的数据来存储表示所述第一场景的最终图像，其中所述至少一个图像包括关键图像，所述关键图像通过比较与所述至少两个图像的每一图像相关联的能量而被选择。12.根据权利要求11所述的装置，其中所述图像模块经配置以使用耦合到所述装置的相机连续俘获所述多个图像。13.根据权利要求11所述的装置，其中在存储所述最终图像之前，所述集成模块经进一步配置以使用所述至少两个图像及与所述至少两个图像相关联的所述辨识的数据来合成所述最终图像，且其中所述存储包括存储所述合成的图像。14.根据权利要求13所述的装置，其中所述合成包括将来自所述至少两个图像...

【专利技术属性】
技术研发人员：百永基，邱衡伊，金杜勋，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人