图表数据的增强识别制造技术

技术编号:15186658 阅读:166 留言:0更新日期:2017-04-19 02:52
可以通过计算设备接收或捕获包含显示图形元素的图表的图像。例如,图形元素可以是条形图的条或饼形图的组件。本文所描述的技术可以确定图形元素的值。本文所描述的技术还可以分析图形元素的布置和其它上下文信息来确定图表类型。所生成的值可以基于图表类型而布置成可编辑图表和/或可编辑数据结构。触摸使能的姿势可以应用于数据结构以允许用户修改、保存或以其它方式处理数据结构。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
随着技术进一步发展数字成像组件的性能和普及性,计算机和便携式设备更常用于捕获和处理打印文档的图像。存在使用不同技术(包括光学字符识别(“OCR”))处理打印文档的图像的多种应用。例如,一些应用使用这些技术来将打印文档转换成文本文件。虽然计算机可以生成包含OCR生成的文本的文件,目前的技术仍会有限制。例如,当图像包含以复杂格式布置的文本和其它上下文标记物时,可能需要手动解释和手动数据输入来确保在图像中传达的信息被正确地输入。这样的耗时的、易出错的过程可能是低效的且会导致不太令人满意的用户体验。针对这些和其它考虑,呈现了在此所做的公开。
技术实现思路
本文描述了用于提供图表数据的增强识别的技术。一般而言,本文所公开的技术解释了图表数据的图像的各个方面,其可以包括指示一个或多个值的任何图形布置,以生成包含数据表格和/或图表的可编辑数据结构。可以通过计算设备来接收或捕获包含显示图形元素的图表或其它布置的图像。图形元素可以是传达值的图像中的任意项。例如,图形元素可以是条形图的条、散点图的点或饼形图的部分。本文所描述的技术可以确定显示或打印在介质上的图形元素的值。介质可以包括能够显示任意数据和/或图形布置的任意电子介质或任何其它物理介质。在一个方面,值可以通过图形元素的测量来确定。在另一方面,值可以通过光学可识别数据的解释来确定,例如描述图表的一个或多个图形元素的文本。在其它方面,可以解释图形元素的布置和/或与图像相关联的其它上下文信息以确定图表类型。所确定的值可以布置成基于图表类型的数据结构。例如,数据结构可以是经渲染来显示基于图像中所包含的图表的可编辑图表的电子表格文件的形式。触摸使能控件可应用于数据结构的呈现而允许用户修改、保存或以其它方式处理数据结构。应当意识到,上述主题可以实现为计算机控制的装置、计算机过程、计算系统或实现为例如计算机可读存储介质的制品。这些特征和其它各个特征将从以下的详细说明的阅读和相关联的附图的阅览中变得显而易见。提供该
技术实现思路
以便以简化的形式来引入下面的具体实施方式中进一步描述的概念的选择。该
技术实现思路
不旨在确定所要求保护的主题的关键特征或主要特征,也不旨在该
技术实现思路
用于限定所要求保护的主题的范围。此外,所要求保护的主题不限于解决在本公开的任意部分所提到的任意或全部缺点的实现方式。附图说明图1是示出用于提供图表数据的增强识别的系统的多个示例的组件的框图。图2是用于捕获具有多个图形元素的图表的图像的设备的透视图。图3是示出了用于提供图表数据的增强识别的方法的方面的流程图。图4A示出了包含条形图和表格的示例的图像,表格布置有对应于条形图的数据。图4B示出了触摸使能的用户界面,显示出所生成数据的表格和由图4A的图像生成的数据所形成的条形图。图5A示出了包含显示有描述性文本的饼形图的示例的图像。图5B示出了触摸使能的用户界面,显示出所生成数据的表格和由图5A的图像生成的数据所形成的饼形图。图6示出了触摸使能的用户界面,还示出了可用于选择图表类型的触摸使能的控件。图7A示出了触摸使能的用户界面,该用户界面显示所生成数据的表格和图5B的饼形图,还示出了可用于编辑饼形图和所生成的数据的触摸使能的控件。图7B示出了触摸使能的用户界面,显示出所生成数据的表格和图5B的饼形图,示出了触摸使能的控件如何用于修改饼形图和所生成的数据的示例。图8是计算机体系结构图,示出了用于能够实现本文所呈现的技术和工艺的方面的计算系统的示例性的计算机硬件和软件体系结构。图9是示出了能够实现本文所呈现的技术和工艺的方面的分布式计算环境的图。图10是计算机体系结构图,示出了能够实现本文所呈现的技术和工艺的方面的计算设备的计算设备体系结构。具体实施方式下面的详细说明涉及用于提供图表数据的增强识别的概念和工艺。一般而言,本文所公开的技术解释了图表数据的图像的各个方面,其可以包括指示一个或多个值的任何图形布置,以生成包含数据表和/或图表的可编辑数据结构。包含显示图形元素的图表的图像可由计算设备接收或捕获。例如,图形元素可以是条形图的条,或饼形图的组件。本文所描述的技术可以确定图形元素的值。在一个方面,值可由图形元素的度量来确定。例如,值可以通过测量条形图的条的长度或者通过测量任何其它特性如饼形图的角或饼形图的组件的表面积来确定。在另一方面,值可以通过识别光学可识别数据(例如,描述图表的一个或多个图形元素的文本)来确定。在其它方面中,图形元素的布置和与图像相关联的其它上下文信息可以被解释以确定图表类型,例如,饼形图、条形图或任何其它类型的图表。所生成的值可以基于图表类型而布置成可编辑的数据结构。例如,数据结构可以是电子表格文件的形式,其可被渲染以显示视觉上类似图像中所包含的图表的可编辑图表。触摸使能控件可应用于数据结构以允许用户修改、保存或以其它方式处理由数据结构定义的图表。在一些实现方式中,所生成的数据结构还可以被配置成存储附加的元数据。在一个示例中,元数据可以包括由计算设备捕获或获得的图像。在这些实现方式中,使用所生成的数据结构的各种应用可使用所存储的图像作为基准点来验证数据结构的可编辑图表和/或其它方面的一个或多个特性。虽然本文所描述的主题是在与计算机系统上的操作系统和应用程序的执行相结合而执行的程序模块的一般上下文中呈现的,本领域技术人员将认识到,可以与其它类型的程序模块相结合来执行其它实现方式。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其它类型的结构。而且,本领域技术人员将意识到,本文所描述的主题可以利用其它计算机系统配置来实现,包括手持式设备、多处理器系统、基于微处理器的或可编程的消费电子设备、微型计算机、主机型计算机等等。在下面的详细说明中,参考了附图,附图构成其部分,并且其中通过示例显示出具体的配置或示例。现在参考附图,示出了用于提供图表数据的增强识别的计算系统、计算机可读存储介质和计算机实现的方法的各方面,其中相似的标记在多幅图中表示相似的元件。如参考图8-10在下面进一步详述的,存在能够实施本文所描述的功能和技术的多个应用和服务。图1是示出了用于提供图表数据的增强识别的本文公开的一个示例性的机制的方面的系统示意图。如图1所示,系统100可以包括计算设备101、远程计算机110和网络120。计算设备101可以作为独立设备来操作,或者计算设备101可以与远程计算机110相结合来操作。所能意识到的是,远程计算机110和计算设备101是通过一个或多个局域网和/或广域网来互连的,例如网络120。应当意识到,除了图1所示的之外,可以使用更多的网络连接。计算设备101可以包括存储数据文件113的本地存储器180和被配置为管理用户与计算设备101之间的交互的程序模块111。程序模块111可以是独立应用、生产应用、操作系统组件或任何其它应用或软件模块的形式,具有经由如键盘的输入设备119和/或可包括被配置为接收来自用户的姿势的触摸使能屏幕的接口118与用户交互的特征。程序模块111还可以控制图像捕获设备116。在本文公开的方面中,图像捕获设备116可以被配置为捕获和/或获得具有布置的字符或图形元素的介质(例如,打印的文档)的输入图像。图像捕获设备116可以是扫本文档来自技高网
...
图表数据的增强识别

【技术保护点】
一种计算机实现的方法,包括计算机实现的操作,所述操作用于:获得具有一个或多个图形元素的图表的图像;确定所述一个或多个图形元素中的单独的图形元素的值;基于所述一个或多个图形元素的布置来确定图表类型;以及基于所述图表类型和所述单独的图形元素的值来生成可编辑图形图表。

【技术特征摘要】
【国外来华专利技术】2014.08.21 US 14/465,3171.一种计算机实现的方法,包括计算机实现的操作,所述操作用于:获得具有一个或多个图形元素的图表的图像;确定所述一个或多个图形元素中的单独的图形元素的值;基于所述一个或多个图形元素的布置来确定图表类型;以及基于所述图表类型和所述单独的图形元素的值来生成可编辑图形图表。2.如权利要求1所述的计算机实现的方法,还包括用于生成存储所述一个或多个图形元素中的单独的图形元素的值的可编辑表格的计算机实现的操作。3.如权利要求1所述的计算机实现的方法,其中确定所述单独的图形元素的值包括测量所述单独的图形元素以获得所述值,其中所述值基于对所述单独的图形元素的测量。4.如权利要求1所述的计算机实现的方法,其中确定所述单独的图形元素的值包括测量所述单独的图形元素的长度以获得所述值,其中所述值基于所述单独的图形元素的长度。5.如权利要求1所述的计算机实现的方法,其中确定所述单独的图形元素的值包括测量所述单独的图形元素的面积以获得所述值,其中所述值至少部分地基于所述单独的图形元素的面积。6.一种计算机,包括:处理器;以及与所述处理器...

【专利技术属性】
技术研发人员:A·L·威尔逊D·帕里什张毅
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1