对移动设备捕获的数字图像中的对象进行分类的系统和方法技术方案

技术编号:12833312 阅读:97 留言:0更新日期:2016-02-07 19:02
在一个实施例中,方法包括接收移动设备捕获的数字图像;并且利用移动设备的处理器:生成数字图像的第一表现,第一表现的特点是分辨率降低;基于第一表现生成第一特征矢量;将第一特征矢量与多个参考特征矩阵进行比较;并且至少部分基于比较,将数字图像中描绘的对象分类为特定对象类别中的成员。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及移动图像捕获以及图像处理,并且具体地,涉及利用移动设备捕获并 处理数字图像以及对此数字图像中检测到的对象进行分类。
技术介绍
其中描绘了包括例如信件、支票、钞票、账单等文档的数字图像的对象惯常由扫描 仪或耦合至计算机工作站(例如笔记本电脑或台式电脑)的多功能外围设备捕获并处理。 本领域中能够执行这种捕获和处理的方法和系统是公知的,并且很好地适于它们用来做的 工作。 然而,在日常的活动、计算以及商业越来越多地使用移动设备的年代,提供类似的 文档捕获和处理系统以及方法以用于部署并使用在移动平台(例如智能手机、数码相机、 平板计算机等)上是非常有益的。 对传统的文档捕获和处理技术进行变革的主要挑战是有限的处理功率和移动设 备中现今可用的硬件能够实现的图像分辨率。这些限制呈现了巨大的挑战,因为处理远低 于通常的扫描仪能够达到的分辨率下捕获的图像是不可能或不切实际的。结果是,传统的 基于扫描仪的处理算法通常对移动设备捕获的数字图像表现不佳。 除此以外,移动设备可用的有限的处理和存储使得扫描仪用的传统的图像处理算 法在计算费用方面极其昂贵。将传统的基于扫描仪的图像处理算法尝试处理成实际应用在 现在的移动平台上会花费太多的时间。 进一步的挑战来自移动捕获组件(例如,移动电话的照相机、平板等)的性质。传 统的扫描仪能够如实地表现数字图像中的物理文档,严格维持纵横比、尺寸以及数字图像 中物理文档的形状,而移动捕获组件往往不能产生这样的结果。 特别地,由摄像机捕获的文档图像呈现了一些在处理扫描仪捕获的图像时没有遇 到过的新的处理问题。这一部分是由于捕获文档图像的方法本身的不同,以及设备的构成 方式不同。一些扫描仪的工作方式是利用运输机制,使纸张和传感器的线性阵列间产生相 对运动。这些传感器在移动时生成文档的像素值,然后捕获的这些像素值以形成图像。传 感器本身的噪音一般有一个水平或垂直的一致性,并且在行间由相同的传感器提供所有像 素。 相反地,摄像机具有许多成非线性阵列的传感器,例如典型地布置成矩形。因此, 所有的这些单个传感器都是独立的,并且渲染不典型具有水平或垂直一致性的图像数据。 此外,摄像机引入了投影效果,这是拍摄图片的角度的函数。例如,通过就像扫描仪中的线 性阵列,即使纸张的运输没有相对传感器的准线完美地正交并且引入了一些歪斜,也没有 像摄像机内的投影效果。此外,用摄像机捕获图像,由于摄像机光学可能引入非线性变形。设计为检测由传统的平板(flat-bed)和/或进纸扫描仪捕获的图像中的文档的 传统图像处理算法也可以利用由页面检测所导出的信息,来尝试把检测到的文档进行分 类,作为特别文档类别的成员。然而,由于利用移动设备的照相机捕获数字图像引入了独 特的挑战,这些传统的分类算法不足以完成并且不能鲁棒地对这种数字图像的文档进行分 类。 而且,即使当文档能被适当地分类时,现今移动设备的硬件局限使得从计算效率 观点来看,利用移动设备完成分类非常昂贵。 鉴于上面呈现的挑战,提供如下这种图像捕获和处理算法与应用是有益的:其补 偿和/或校正与利用移动设备进行图像捕获、处理以及分类相关联的问题,同时经由有效 的处理方法维持低计算成本。 而且,提供如下这种对象分类系统、方法以及计算机程序产品将是本领域中的进 一步改进:其能够鲁棒地将对象分配到特定的对象,并且利用已知的类别成员信息进一步 致力于并且克服独特的处理利用移动设备的照相机捕获的图像所固有的挑战照相机。
技术实现思路
在一个实施例中,方法包括:接收移动设备捕获的数字图像;并且利用移动设备 的处理器:生成数字图像的第一表现,第一表现的特点是分辨率降低;基于第一表现生成 第一特征矢量;将第一特征矢量与多个参考特征矩阵进行比较;并且至少部分基于比较, 将数字图像中描绘的对象分类为特定对象类别中的成员。 在另一个实施例中,方法包括:基于移动设备捕获的数字图像生成第一特征矢量; 将第一特征矢量与多个参考特征矩阵进行比较;并且至少部分基于比较,将对数字图像中 描绘的对象分类为特定对象类别中的成员;并且至少部分基于特别对象类别,确定一个或 多个对象的对象特征;并且利用移动设备的处理器执行至少一个处理操作,该至少一个处 理操作从由下列组成的组中选择:至少部分基于一个或多个对象特征,检测数字图像中描 绘的对象;至少部分基于一个或多个对象特征,矩形化数字图像中描绘的对象;至少部分 基于一个或多个对象特征,裁剪数字图像;并且至少部分基于一个或多个对象特征,二值化 数字图像。 仍然在另一个实施例中,系统包括处理器;以及处理器内的逻辑和/或处理器可 执行逻辑,使得处理器可以:生成由移动设备捕获的数字图像的第一表现;基于第一表现 生成第一特征矢量;将第一特征矢量与多个参考特征矩阵进行比较;并且至少部分基于比 较,将数字图像中描绘的对象分类为特定对象类别中的成员。 仍然还在另一个实施例中,计算机程序产品包括嵌入了程序代码的计算机可读存 储介质,程序代码可由处理器读取和/或执行,从而:生成由移动设备捕获的数字图像的 第一表现;基于第一表现生成第一特征矢量;将第一特征矢量与多个参考特征矩阵进行比 较;并且至少部分基于比较,将数字图像中描绘的对象分类为特定对象类别中的成员。【附图说明】 图1阐释了根据一个实施例的网络体系架构。 图2示出了根据一个实施例的可与图1中的服务器和/或客户端相关联的典型的 硬件环境。 图3A描绘了根据一个实施例的对象的数字图像。 图3B描绘了根据一个实施例的图3A中示出的为了生成数字图像的第一表现而被 分成多个截面的数字图像的图示。 图3C描绘了图3A中示出的数字图像的第一表现,第一表现的特点是相对于数字 图像其分辨率降低了。 图4A是根据一个实施例的文档的数字图像中描绘的多个子分区的图示。 图4B是根据一个实施例的图4A中示出的数字图像的掩膜表现。 图4C是根据一个实施例的图4A中示出的数字图像的掩膜表现。 图4D是根据一个实施例的图4A中示出的数字图像的掩膜表现。 图5是根据一个实施例的方法的流程图。 图6是根据一个实施例的方法的流程图。【具体实施方式】 进行下面的描述是出于阐释本专利技术的总则的目的,并且并不意味着限定其中要求 保护的创造性概念。进一步地,在各种可能的组合和排列的每一个中,此处描述的特定特征 可以和描述的其他特征组合使用。 除非其中进行了特别限定,否则给予所有术语它们最宽的可能解释,包括说明书 中隐含的意思以及本领域技术人员能够理解和/或字典、论文等限定的意思。 也必须注意到,除非另有说明,如在说明书和所附权利要求书中使用的,单数形式 的"一"、"一个"和"所述一个"包括复数指示物。 本申请涉及由照相机,尤其是移动设备的照相机,捕获的图像(图片,图解,图形 示意图,电影、视频、影片、剪辑等的一帧)的图像处理。如此处所理解的,移动设备是指 能够不需要通过物理连接(如,导线、电线、电缆等)供应能量而能接收数据或不需要物理 数据连接(如,导线、电线、电缆等)而能接收数据的任何设备。本公开范围内的移动设 备包括示例性的设备,例如移动电话、智能手机、平板、个人数字助理、iPod_?,iPad⑧, 黑莓⑧设备等。 然而,由于对各种功能的描本文档来自技高网
...

【技术保护点】
一种方法,包括:接收移动设备捕获的数字图像;并且利用所述移动设备的处理器:生成所述数字图像的第一表现,所述第一表现的特点是分辨率降低;基于所述第一表现生成第一特征矢量;将所述第一特征矢量与多个参考特征矩阵进行比较;并且至少部分基于所述比较,将所述数字图像中描绘的对象分类为特定对象类别的成员。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:简·维勒斯·阿姆特鲁普安东尼·马乔拉斯蒂芬·迈克尔·汤普森马继勇亚历山大·舒斯特洛维奇克里斯多夫·W·斯拉舍
申请(专利权)人:柯法克斯公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1