针对图像的多区域检测制造技术

技术编号:28118289 阅读:26 留言:0更新日期:2021-04-19 11:20
由相机捕捉的图像可以被扫描应用处理,以标识图像中适合扫描的一个或多个区域。这些区域中的一个或多个区域可以基于对显示屏幕的特定部分的用户输入(诸如指尖触摸)而被选择用于自动扫描。用户还可以选择多个区域并且提交多个四边形区域,用于从单个图像扫描到PDF。用于从单个图像扫描到PDF。用于从单个图像扫描到PDF。

【技术实现步骤摘要】
【国外来华专利技术】针对图像的多区域检测

技术介绍

[0001]在移动设备中,包括相机的计算设备越来越常见,包括膝上型计算机、平板电脑、数码相机、智能手机和其它移动数据、消息传递和/或通信设备。通常,用户使用与计算设备相关联的相机来拍摄各种图片,例如风景、人物、演示、白板、名片、文档、草图、绘画等图像。用户可以参考所捕捉的图像以回忆其中包含的信息,例如示意图、图片、列表和其它文本,和/或以电子方式将其交给其他用户、存储服务或设备。然而,传统上,相机捕捉的图像是静态的,并且提取图像中的特定区域以经由扫描来获得电子可用和/或可编辑信息可能是有挑战性的。
[0002]另外,因为照片通常尺寸很大,并且包括丰富的文本和图形信息,通过设备捕捉而自动选择的图像区域可能不是用户想要的。识别包括用户感兴趣项目的图像特定部分仍然是低效且容易出差错的。因此,仍然有广阔空间来提出针对图像的有效扫描和用户对图像范围选择过程的管理的新的和改进的构思。

技术实现思路

[0003]根据本公开的第一方面的一种数据处理设备包括至少一个处理器以及一个或多个计算机可读介质。计算机可读介质包括指令,该指令当由至少一个处理器执行时,使至少一个处理器经由图像扫描应用在显示器上呈现图像。该指令还使至少一个处理器接收与图像的第一区相关联的第一输入,并且在响应于接收到第一输入,自动检测包括至少第一区的第一区域,该第一区域由第一周界定边界。该指令还使至少一个处理器经由图像扫描应用在显示器上向用户呈现第一区域作为用于扫描的潜在区域。
[0004]根据本公开的第二个方面的一种方法包括经由图像扫描应用在显示器上呈现图像。该方法还包括接收与图像的第一区相关联的第一输入。另外,该方法涉及响应于接收到第一输入自动检测包括至少第一区的第一区域。该第一区域由第一周界定边界。此外,该方法包括经由图像扫描应用在显示器上向用户呈现第一区域作为用于扫描的潜在区域。
[0005]根据本公开的第三个方面的一种方法包括经由图像扫描应用在显示器上呈现图像,以及接收与图像的第一区相关联的第一输入。另外,该方法包括在响应于接收到第一输入自动呈现包括至少第一区的第一四边形区域。在另一个步骤中,该方法包括接收与图像的第二区相关联的第二输入,其中第二区位于第一四边形区域的外侧。此外,该方法包括响应于接收到第二输入自动呈现包括至少第一四边形区域的第二四边形区域。
[0006]提供本
技术实现思路
以简化形式介绍一些概念,这些概念将在下面的具体实施方式中进一步描述。本
技术实现思路
既不旨在标识所要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求保护的技术方案的范围。此外,所要求保护的技术方案不限于解决在本公开的任何部分中指出的任何或所有缺点的实施方式。
附图说明
[0007]附图描绘了根据仅作为示例而非限制的本公开的一个或多个实施例。在附图中,
相似的附图标记指代相同或相似的元素。此外,应当理解,附图不一定是按比例绘制的。
[0008]图1A和图1B均图示了图像扫描应用和环境的实现;
[0009]图2是图示了用于管理图像中的区域以用于扫描的分布式计算环境的一个实现的概念图;
[0010]图3是图示了被配置为提供扫描工具和真实世界设定的应用的用户界面的实现的显示图;
[0011]图4是图示了被配置为向扫描工具提供所选择的图像中的第一区域的用户界面的实现的显示图;
[0012]图5A和图5B是显示图,其图示了被配置为提供扫描工具的用户界面的实现,其中第一用户输入使图像中的不同的第二区域被选择;
[0013]图6A和图6B是显示图,其图示了被配置为提供扫描工具的用户界面的实现,其中第二用户输入使图像中的不同的第三区域被选择;
[0014]图7是显示图,其图示了被配置为提供扫描工具的应用的用户界面的实现,其中图像中的第一区域被选择;
[0015]图8A和图8B是显示图,其图示了被配置为提供扫描工具的应用的用户界面的实现,其中第一用户输入使图像中的不同的第二区域被选择,第二区域包括第一区域;
[0016]图9A和图9B是显示图,其中图示被配置以提供扫描工具的应用的用户界面的实现,其中第二用户输入使图像中的不同的包括第三区域被选择;
[0017]图10A

10G是图示了被配置为响应于多个用户输入来检测图像中的变化区域的应用的实现的示意图;
[0018]图11A和图11B是显示图,其图示了被配置为提供扫描工具的应用的用户界面的实现,其中第一用户输入使图像中的不同的第二区域被选择;
[0019]图12是针对扫描选择工具的实现的过程流程图;
[0020]图13是图示了用于管理扫描选择的过程的实现的流程图;
[0021]图14是示例计算设备的框图,该示例计算设备可以被用于提供本文描述的机制的实现;以及
[0022]图15是图示了被配置为从机器可读介质读取指令的示例机器的组件的框图。
具体实施方式
[0023]在下面的具体实施方式中,通过示例阐述了许多具体细节以便提供对相关教导的透彻理解。然而,应当清楚,可以没有这样的细节的情况下实践本公开。在其它情况下,在相对较高的水平且没有细节的情况下,描述了众所周知的方法、程序、组件和/或电路装置,以避免不必要地混淆本公开的各个方面。
[0024]以下实现介绍扫描应用工具箱,该工具箱可以通过接收输入来增强用户的扫描体验,该应用可以利用该输入来确定图像中的哪个区域将被检测和/或标识为用于扫描。传统上,扫描工作流程包括一系列步骤,其中用户可以:(1)将相机对准文档;(2)拍照;(3)裁剪或拖动文档边界以更精确地围绕感兴趣的对象;(4)清洁所选择的图像内容(滤波、透视校正等)以及;(5)保存文件和/或共享扫描项。为了标识用于扫描的区域,一些应用可能会检测被称为“四边形”或四边形形状的区域。在一些情况下,四边形表示文档或其它对象,其中
andandandGoogle和Helmut FilmGoogleEvernoteEvernote这些非限制示例以及任何其它电子内容编辑或查看应用可以从本公开的实现获益。
[0030]在图像的扫描期间,在有多个潜在区域可供扫描的情况下,端用户可能会被减缓或阻碍。用于本申请的目的,扫描或进行扫描指代应用用以标识、选择、分隔或以其它方式来确定图像中用户可能感兴趣的特定区域的边界的机制。因此,扫描可以实时发生(例如,当相机指向场景或对象时),和/或在捕捉、生成或在存储器中存储图像之后发生,并且可以被理解为允许对图像中的特定区域的高分辨率捕捉。换句话说,在一些实现中,扫描可以涉及在更大的捕捉的图像中捕捉更小区域。
[0031]以下的实现被配置为向用户提供能够检测给定位点周围的四边形。在一些实现中,如果多个四边形在图像中可用或被检测到,用户在与想要的四边形相关的范围中的手指轻敲,可以配置为帮助确定与“轻敲”区域相关的潜在四边形的边界(例如,周界)。这样的应用能使用户捕捉一个或多个他们选择的四边形。因此,在不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种数据处理设备,包括至少一个处理器;以及包括指令的一个或多个计算机可读介质,所述指令当被所述至少一个处理器执行时,使至少一个处理器:经由图像扫描应用在显示器上呈现图像,接收与所述图像的第一区相关联的第一输入,响应于接收到所述第一输入,自动检测至少包括所述第一区的第一区域,所述第一区域包括与第一周界相关联的边界,以及经由所述图像扫描应用在所述显示器上向用户呈现所述第一区域作为用于扫描的潜在区域。2.根据权利要求1所述的设备,其中所述指令还使所述至少一个处理器:接收与所述图像的第二区相关联的第二输入,其中所述第二区与所述第一区不同;以及响应于所述第二输入,自动检测与所述第一区域不同并且至少包括所述第二区的第二区域。3.根据权利要求1所述的设备,其中所述指令还使所述至少一个处理器:接收与所述图像的所述第一区相关联的第二输入;以及响应于所述第二输入,自动检测与所述第一区域不同并且至少包括所述第一区的第二区域。4.根据权利要求1所述的设备,其中所述指令还使所述至少一个处理器:通过显示与所述第一周界相关联的视觉指示符来指定所述第一区域。5.根据权利要求2所述的设备,其中所述第二区域包括所述第一区和所述第二区。6.根据权利要求2所述的设备,其中所述第二区域排除所述第一区。7.根据权利要求1所述的设备,其中所述指令还使所述至少一个处理器:接收与所述第一区域的所述边界的一部分相关联的第二输入;以及响应于所述第二输入,调整所述第一区域的所述边界,使得所述边界变为与不同于所述第一周界的第二周界相关联。8.一种方法,包括:经由图像扫描应用在显示器上呈现图像;接收与所述图像的第一区相关联的第一输入;响应于接收到所述第一输入,自动检测至少包括所述第一区的第一区域,所述第一区域由第一周界定...

【专利技术属性】
技术研发人员:A
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1