针对图像的多区域检测制造技术

技术编号:37362010 阅读:11 留言:0更新日期:2023-04-27 07:10
由相机捕捉的图像可以被扫描应用处理,以标识图像中适合扫描的一个或多个区域。这些区域中的一个或多个区域可以基于对显示屏幕的特定部分的用户输入(诸如指尖触摸)而被选择用于自动扫描。用户还可以选择多个区域并且提交多个四边形区域,用于从单个图像扫描到PDF。用于从单个图像扫描到PDF。用于从单个图像扫描到PDF。

【技术实现步骤摘要】
针对图像的多区域检测
[0001]本申请是本申请是申请号为201980059136.0,申请日为2019年6月25日、优先权日为2018年9月10日、题为“针对图像的多区域检测”的专利技术专利申请的分案申请。

技术介绍

[0002]在移动设备中,包括相机的计算设备越来越常见,包括膝上型计算机、平板电脑、数码相机、智能手机和其它移动数据、消息传递和/或通信设备。通常,用户使用与计算设备相关联的相机来拍摄各种图片,例如风景、人物、演示、白板、名片、文档、草图、绘画等图像。用户可以参考所捕捉的图像以回忆其中包含的信息,例如示意图、图片、列表和其它文本,和/或以电子方式将其交给其他用户、存储服务或设备。然而,传统上,相机捕捉的图像是静态的,并且提取图像中的特定区域以经由扫描来获得电子可用和/或可编辑信息可能是有挑战性的。
[0003]另外,因为照片通常尺寸很大,并且包括丰富的文本和图形信息,通过设备捕捉而自动选择的图像区域可能不是用户想要的。识别包括用户感兴趣项目的图像特定部分仍然是低效且容易出差错的。因此,仍然有广阔空间来提出针对图像的有效扫描和用户对图像范围选择过程的管理的新的和改进的构思。

技术实现思路

[0004]根据本公开的第一方面的一种数据处理设备包括至少一个处理器以及一个或多个计算机可读介质。计算机可读介质包括指令,该指令当由至少一个处理器执行时,使至少一个处理器经由图像扫描应用在显示器上呈现图像。该指令还使至少一个处理器接收与图像的第一区相关联的第一输入,并且在响应于接收到第一输入,自动检测包括至少第一区的第一区域,该第一区域由第一周界定边界。该指令还使至少一个处理器经由图像扫描应用在显示器上向用户呈现第一区域作为用于扫描的潜在区域。
[0005]根据本公开的第二个方面的一种方法包括经由图像扫描应用在显示器上呈现图像。该方法还包括接收与图像的第一区相关联的第一输入。另外,该方法涉及响应于接收到第一输入自动检测包括至少第一区的第一区域。该第一区域由第一周界定边界。此外,该方法包括经由图像扫描应用在显示器上向用户呈现第一区域作为用于扫描的潜在区域。
[0006]根据本公开的第三个方面的一种方法包括经由图像扫描应用在显示器上呈现图像,以及接收与图像的第一区相关联的第一输入。另外,该方法包括在响应于接收到第一输入自动呈现包括至少第一区的第一四边形区域。在另一个步骤中,该方法包括接收与图像的第二区相关联的第二输入,其中第二区位于第一四边形区域的外侧。此外,该方法包括响应于接收到第二输入自动呈现包括至少第一四边形区域的第二四边形区域。
[0007]提供本
技术实现思路
以简化形式介绍一些概念,这些概念将在下面的具体实施方式中进一步描述。本
技术实现思路
既不旨在标识所要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求保护的技术方案的范围。此外,所要求保护的技术方案不限于解决在本公开的任何部分中指出的任何或所有缺点的实施方式。
附图说明
[0008]附图描绘了根据仅作为示例而非限制的本公开的一个或多个实施例。在附图中,相似的附图标记指代相同或相似的元素。此外,应当理解,附图不一定是按比例绘制的。
[0009]图1A和图1B均图示了图像扫描应用和环境的实现;
[0010]图2是图示了用于管理图像中的区域以用于扫描的分布式计算环境的一个实现的概念图;
[0011]图3是图示了被配置为提供扫描工具和真实世界设定的应用的用户界面的实现的显示图;
[0012]图4是图示了被配置为向扫描工具提供所选择的图像中的第一区域的用户界面的实现的显示图;
[0013]图5A和图5B是显示图,其图示了被配置为提供扫描工具的用户界面的实现,其中第一用户输入使图像中的不同的第二区域被选择;
[0014]图6A和图6B是显示图,其图示了被配置为提供扫描工具的用户界面的实现,其中第二用户输入使图像中的不同的第三区域被选择;
[0015]图7是显示图,其图示了被配置为提供扫描工具的应用的用户界面的实现,其中图像中的第一区域被选择;
[0016]图8A和图8B是显示图,其图示了被配置为提供扫描工具的应用的用户界面的实现,其中第一用户输入使图像中的不同的第二区域被选择,第二区域包括第一区域;
[0017]图9A和图9B是显示图,其中图示被配置以提供扫描工具的应用的用户界面的实现,其中第二用户输入使图像中的不同的包括第三区域被选择;
[0018]图10A

10G是图示了被配置为响应于多个用户输入来检测图像中的变化区域的应用的实现的示意图;
[0019]图11A和图11B是显示图,其图示了被配置为提供扫描工具的应用的用户界面的实现,其中第一用户输入使图像中的不同的第二区域被选择;
[0020]图12是针对扫描选择工具的实现的过程流程图;
[0021]图13是图示了用于管理扫描选择的过程的实现的流程图;
[0022]图14是示例计算设备的框图,该示例计算设备可以被用于提供本文描述的机制的实现;以及
[0023]图15是图示了被配置为从机器可读介质读取指令的示例机器的组件的框图。
具体实施方式
[0024]在下面的具体实施方式中,通过示例阐述了许多具体细节以便提供对相关教导的透彻理解。然而,应当清楚,可以没有这样的细节的情况下实践本公开。在其它情况下,在相对较高的水平且没有细节的情况下,描述了众所周知的方法、程序、组件和/或电路装置,以避免不必要地混淆本公开的各个方面。
[0025]以下实现介绍扫描应用工具箱,该工具箱可以通过接收输入来增强用户的扫描体验,该应用可以利用该输入来确定图像中的哪个区域将被检测和/或标识为用于扫描。传统上,扫描工作流程包括一系列步骤,其中用户可以:(1)将相机对准文档;(2)拍照;(3)裁剪或拖动文档边界以更精确地围绕感兴趣的对象;(4)清洁所选择的图像内容(滤波、透视校
正等)以及;(5)保存文件和/或共享扫描项。为了标识用于扫描的区域,一些应用可能会检测被称为“四边形”或四边形形状的区域。在一些情况下,四边形表示文档或其它对象,其中任何其它场景工件或背景都被放弃或去除。然而,传统的基于扫描的应用经常指定图像中的不需要的四边形区域。此外,在图像中可能检测到多个四边形的情况下,检测到用户想要捕捉的特定四边形的可能性较低。本公开的实现允许用户查看先前捕捉的(静态)图像和/或实时捕捉(直播)的图像,并且允许用户提交可以被用于标识图像中的特定四边形以用于扫描的输入。当处理电子内容时,快速和有效地指导应用对想要的图像部分进行扫描可以让用户提高工作流程效率。此外,该系统可以在用户查看较大图像时,为用户提供对可扫描图像内容的多个不同区域的存在或可用性的更广泛感知。
[0026]如上文所介绍,各种应用可以被用于捕捉和/或编辑数字图像或电子内容。用于该描述的目的,术语“电子内容”或“图像”包括可以被视觉表示的任何数字数据,包括但不限于电子文档、媒体流、实时视频捕捉、实时图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:经由图像扫描应用在显示器上呈现图像;接收与所述图像的第一区相关联的第一输入;响应于接收到所述第一输入,自动检测至少包括所述第一区的第一区域,所述第一区域由第一周界定边界;经由所述图像扫描应用在所述显示器上向用户呈现所述第一区域作为用于扫描的潜在区域;接收与所述图像的第二区相关联的第二输入,其中所述第二区与所述第一区不同;响应于所述第二输入,自动检测与所述第一区域不同并且至少包括所述第二区的第二区域,其中所述第二区域由第二周界定边界;以及响应于接收到所述第二输入,自动选择在所述第一周界和所述第二周界之间延伸的有孔区域用于扫描。2.一种方法,包括:经由图像扫描应用在显示器上呈现图像;接收与所述图像的第一区相关联的第一输入;响应于接收到所述第一输入,自动呈现至少包括所述第一区的第一区域;接收与所述图像的第二区相关联的第二输入,所述第二区位于第一区域之外;响应于接收到所述第二输入,自动呈现至少包括所述第一区域的第二区域作为用于扫描的潜在区域;接收与所...

【专利技术属性】
技术研发人员:A
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1