光学字符辨识(OCR)高速缓冲存储器更新制造技术

技术编号:10548540 阅读:188 留言:0更新日期:2014-10-16 15:45
本文中所描述的技术提供一种用于自动地及智能地创建及更新OCR高速缓冲存储器同时使用计算装置执行OCR的方法。可将使用耦合到所述计算装置的相机俘获的图像与存储于所述OCR高速缓冲存储器中的现有图像进行匹配。如果发现匹配,那么可用利用新图像的新或较佳信息来更新所述OCR高速缓冲存储器。所述匹配的现有图像可保留在所述OCR高速缓冲存储器中,或新俘获的图像可替换所述OCR高速缓冲存储器中的所述匹配的现有图像。在一个实施例中,描述了用以在将所述图像存储于所述OCR高速缓冲存储器中之前移除或减少眩光的技术。在一些实施例中,在不执行OCR的情况下移除或减少眩光。

【技术实现步骤摘要】
【国外来华专利技术】光学字符辨识(OCR)高速缓冲存储器更新
技术介绍
光学字符辨识(OCR)为手写的、用打字机打出的或印刷的文本、图形或符号到机器编码的文本的机械或电子转译。OCR为计算机视觉及扩增实境应用中的正在发展的研究领域。计算机视觉允许装置感知其附近的环境。计算机视觉通过允许来自终端用户与真实世界的互动的感测输入扩展到虚拟世界中而实现扩增实境中的应用。在真实生活实例应用中,具备计算机视觉能力的OCR可帮助视觉残障人士感知例如智能电话等个人移动装置的相机的视野中的书面文本及符号。
技术实现思路
本文中所描述的技术提供一种用于在扩增实境的应用中自动地及智能地创建及/或更新OCR高速缓冲存储器同时使用移动装置执行OCR的方法。使用耦合到所述移动装置的相机俘获的图像与存储于所述OCR高速缓冲存储器中的现有图像进行匹配。如果发现匹配,那么用利用新图像的新及/或较佳信息来更新所述OCR高速缓冲存储器,而不是将所述新图像作为单独条目存储于所述OCR高速缓冲存储器中。或者,所述新图像可替换所述OCR高速缓冲存储器中的所述现有图像。另外,描述了用以使用多个图像从图像移除眩光的技术。举例来说,来自图像的区的眩光可通过使用来自相同场景的不具有与关键图像相同的区的眩光的另一图像的信息来移除。在一个实施例中,可甚至在无OCR的情况下从图像减少或移除眩光。在一个实施例中,可组合地执行眩光减少及OCR高速缓存。智能及自动OCR高速缓冲存储器更新对用户来说是有利的,因为其允许用户存取与相同场景相关联的所有信息及/或可允许用户存取与多个场景相关联的信息。此外,在随着时间的过去与相同场景的多个图像之间的图像信息重叠的情况下,本文中所描述的技术可存储与场景相关联的最佳或新获得的信息,因此随着时间的过去进一步细化结果。与本文中所描述的技术相关联的其它优势可包含用于存储OCR结果的减少的存储器空间及对OCR高速缓冲存储器的减少的命中数目,从而导致整个系统中的较快性能。通过实例,如果用户正坐在餐馆里且使用用于使用快照模式或预览模式获取图像的传统手段对晚餐菜单执行OCR,那么用户可需要获取多个图像且单独地处理与所述图像相关联的信息。如果用户离晚餐菜单太远地抓住获取图像的相机,那么图像可不具有足够的分辨率来适当地对图像执行OCR。另一方面,如果用户使获取图像的相机太靠近,那么图像可不包含所关注的整个区域。然而,使用具有自动及智能OCR高速缓冲存储器更新的OCR高速缓存模式,本文中所描述的技术允许用户产生包含来自菜单的用户所关注的区域的单个图像,其中以良好的分辨率进行恰当聚焦。在一个情况中,用户可选择从菜单中选择文本且将其转译为另一语言或使用在线搜索引擎执行搜索。在上文实例中,来自场景的图像中的一者可具有与图像的区相关联的眩光。所描述的技术可通过从第一图像中识别具有眩光的第一区,从第二图像中识别不具有眩光的第二区来促进移除眩光,其中第一区及第二区表示来自相同场景的相同区。使用第一图像及来自第二图像的不具有眩光的第二区来合成最终图像以移除眩光。用于执行本专利技术的实施例的示范性方法可包含接收多个图像,辨识所述多个图像中的每一者中的数据,其中辨识所述多个图像中的每一者中的数据包括对所述多个图像执行光学字符辨识,至少部分基于所述辨识的数据确定所述多个图像中的至少两个图像包括来自第一场景的信息,及使用所述至少两个图像中的至少一个图像及与所述至少一个图像相关联的所述辨识的数据来存储表示所述第一场景的最终图像。在一个实施例中,接收包括使用相机连续俘获所述多个图像。在一个实施方案中,维持所述多个图像中的所述至少一个图像及所述至少一个图像的所述辨识的数据的存储,同时俘获后面的图像且在所述后面的图像中辨识数据。在一个方面中,确定所述多个图像中的至少两个图像包括来自第一场景的信息可包含比较两个或两个以上图像中的每一者中的图形对象值、图形对象颜色、背景颜色及前景颜色中的一或多者。在一个实施例中,在存储所述最终图像之前,所述方法进一步包括使用所述至少两个图像及与所述至少两个图像相关联的所述辨识的数据来合成所述最终图像及接着随后存储所述最终图像。在一个实施方案中,所述合成包括将来自所述至少两个图像中的第二图像的元素并入到所述至少一个图像中以创建所述最终图像。在另一实施例中,所述最终图像包括所述至少一个图像,其中所述合成包括将所述至少两个图像中的第二图像的相关联的数据并入到所述至少一个图像的相关联的数据中。在另一实施例中,在存储所述最终图像之前,所述方法进一步包括从用以表示所述第一场景的所述至少两个图像中选择所述至少一个图像作为所述最终图像,及接着随后存储所述最终图像。选择可包括比较所述两个或两个以上图像中的每一者的能量。计算所述两个或两个以上图像中的每一者的所述能量可基于每一图像中辨识的数个图形对象及用于所述数个图形对象中的每一者的辨识的置信度。所述方法可进一步包含确定所述多个图像中的一或多个图像包括来自除了所述第一场景之外的一或多个场景的信息,及显示所述最终图像及分别表示所述一或多个场景的一或多个图像或所述至少一个图像及所述一或多个场景的所述辨识的数据。此外,由本专利技术的实施例执行的所述方法还可包含确定所显示的图像中的用户选定的图像或一个图像的所显示的辨识的数据,及将与所述选定的图像或辨识的数据相关的信息输入到程序或应用程序中。在一个实施方案中,所述方法还可通过从来自所述第一场景的所述两个或两个以上图像的第一图像中识别具有眩光的第一区,从来自所述第一场景的所述两个或两个以上图像的第二图像中识别不具有眩光的第二区,其中所述第一区及所述第二区表示所述第一场景的相同区,且使用所述第一图像及来自所述第二图像的不具有眩光的所述第二区合成具有减少的眩光的所述最终图像。用于执行本专利技术的实施例的示范性装置可包含:图像模块,其经配置以接收多个图像;OCR引擎,其经配置以使用光学字符辨识来辨识所述多个图像中的每一者中的数据;匹配模块,其经配置以至少部分基于所述辨识的数据确定所述多个图像中的至少两个图像包括来自第一场景的信息;及集成模块,其经配置以使用所述至少两个图像中的至少一个图像及与所述至少一个图像相关联的所述辨识的数据来存储表示所述第一场景的最终图像。可使用耦合到所述装置的相机连续俘获或获得所述图像。在一个实施例中,确定包括比较所述两个或两个以上图像中的每一者中的图形对象值、图形对象颜色、背景颜色、前景颜色及边界框中的一或多者。集成模块可经进一步配置以使用所述至少两个图像及与所述至少两个图像相关联的所述辨识的数据来合成所述最终图像,及接着随后存储所述最终图像。在一个实施例中,所述合成包括将来自所述至少两个图像中的第二图像的元素并入到所述至少一个图像中以创建所述最终图像。在另一实施例中,所述最终图像包括所述至少一个图像,其中所述合成包括将所述至少两个图像中的第二图像的相关联的数据并入到所述至少一个图像的相关联的数据中。在存储所述最终图像之前,选择模块可经配置以从用以表示所述第一场景的所述至少两个图像中选择所述至少一个图像作为所述最终图像,及接着随后存储所述最终图像。在一个实施方案中,选择包括比较所述两个或两个以上图像中的每一者的能量。基于每一图像中辨识的数个图形对象及用于所述数个图形对象中的每一者的辨识本文档来自技高网...
光学字符辨识(OCR)高速缓冲存储器更新

【技术保护点】
一种方法,其包括:接收多个图像;辨识所述多个图像中的每一者中的数据,其中辨识所述多个图像中的每一者中的数据包括对所述多个图像执行光学字符辨识;至少部分基于所述辨识的数据确定所述多个图像中的至少两个图像包括来自第一场景的信息;及使用所述至少两个图像中的至少一个图像及与所述至少一个图像相关联的所述辨识的数据来存储表示所述第一场景的最终图像。

【技术特征摘要】
【国外来华专利技术】2012.01.09 US 61/584,765;2013.01.08 US 13/736,5271.一种用于执行光学字符辨识的方法,其包括:接收多个图像;辨识所述多个图像中的每一者中的数据,其中辨识所述多个图像中的每一者中的数据包括对所述多个图像执行光学字符辨识;至少部分基于所述辨识的数据确定所述多个图像中的至少两个图像包括来自第一场景的信息;基于每一图像中辨识的数个图形对象及用于所述数个图形对象中的每一者的辨识的置信度计算所述至少两个图像的每一者的能量;使用所述至少两个图像中的至少一个图像及与所述至少一个图像相关联的所述辨识的数据来存储表示所述第一场景的最终图像,其中所述至少一个图像包括关键图像,所述关键图像通过比较与所述至少两个图像的每一图像相关联的能量而被选择。2.根据权利要求1所述的方法,其中所述接收包括使用相机连续俘获所述多个图像。3.根据权利要求1所述的方法,其中维持所述多个图像中的所述至少一个图像及所述至少一个图像的所述辨识的数据的存储,同时俘获后面的图像且在所述后面的图像中辨识数据。4.根据权利要求1所述的方法,其中在存储所述最终图像之前,所述方法进一步包括使用所述至少两个图像及与所述至少两个图像相关联的所述辨识的数据来合成所述最终图像,其中所述存储包括存储所述合成的图像。5.根据权利要求4所述的方法,其中所述合成包括将来自所述至少两个图像中的第二图像的元素并入到所述至少一个图像中以创建所述最终图像。6.根据权利要求4所述的方法,其中所述最终图像包括所述至少一个图像,其中所述合成包括将所述至少两个图像中的第二图像的所述辨识的数据并入到所述至少一个图像的所述辨识的数据中。7.根据权利要求1所述的方法,其中所述确定包括比较所述至少两个图像中的每一者中的图形对象值、图形对象颜色、背景颜色及前景颜色中的一或多者。8.根据权利要求1所述的方法,其进一步包括确定所述多个图像中的一或多个图像包括来自除了所述第一场景之外的一或多个场景的信息,及显示所述最终图像及分别表示所述一或多个场景的一或多个图像,或显示所述至少一个图像及所述一或多个场景的所述辨识的数据。9.根据权利要求8所述的方法,其进一步包括确定用户选择了显示的图像中的一者或所述一个图像的所显示的辨识的数据,及将与选择的图像或辨识的数据相关的信息输入到程序中。10.根据权利要求1所述的方法,其中在存储所述最终图像之前,所述方法进一步包括:从来自所述第一场景的两个或两个以上图像的第一图像中识别具有眩光的第一区;从来自所述第一场景的所述两个或两个以上图像的第二图像中识别不具有眩光的第二区,其中所述第一区及所述第二区表示所述第一场景的相同区;及使用所述第一图像及来自所述第二图像的不具有眩光的所述第二区合成具有减少的眩光的所述最终图像。11.一种移动装置,其包括:一个或多个处理器;一个或多个计算机可读存储装置,其耦合到所述一个或多个处理器;存储在所述一个或多个计算机可读存储装置中且经配置以被所述一个或多个处理器执行的多个模块,所述多个模块包括:图像模块,其经配置以接收多个图像;OCR引擎,其经配置以使用光学字符辨识来辨识所述多个图像中的每一者中的数据;匹配模块,其经配置以至少部分基于所述辨识的数据确定所述多个图像中的至少两个图像包括来自第一场景的信息;选择模块,其经配置以从所述至少两个图像中选择至少一个图像,其中选择所述至少一个图像包括基于每一图像中辨识的数个图形对象及用于所述数个图形对象中的每一者的辨识的置信度计算所述至少两个图像的每一者的能量;及集成模块,其经配置以使用所述至少两个图像中的至少一个图像及与所述至少一个图像相关联的所述辨识的数据来存储表示所述第一场景的最终图像,其中所述至少一个图像包括关键图像,所述关键图像通过比较与所述至少两个图像的每一图像相关联的能量而被选择。12.根据权利要求11所述的装置,其中所述图像模块经配置以使用耦合到所述装置的相机连续俘获所述多个图像。13.根据权利要求11所述的装置,其中在存储所述最终图像之前,所述集成模块经进一步配置以使用所述至少两个图像及与所述至少两个图像相关联的所述辨识的数据来合成所述最终图像,且其中所述存储包括存储所述合成的图像。14.根据权利要求13所述的装置,其中所述合成包括将来自所述至少两个图像...

【专利技术属性】
技术研发人员:百永基邱衡伊金杜勋
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1