当前位置: 首页 > 专利查询>微软公司专利>正文

上下文树中的分析替换制造技术

技术编号:2930135 阅读:254 留言:0更新日期:2012-04-11 18:40
描述了在墨水树网格内存储替换识别结果的系统、方法、数据结构、以及应用编程接口。

【技术实现步骤摘要】
技术
技术介绍
领域本专利技术的各方面涉及计算系统。更具体地,本专利技术的各方面涉及处理来自识别系统的替换。相关技术的描述除了处理文本之外,现在计算机有记录和修改电子墨水的能力。电子墨水可以天然的形式保存或被识别为文本。电子墨水的识别不总是完美的。识别过程除了基于人们当前书写上下文,还基于人的笔迹的清晰度而变化。计算系统提供给用户替换以使用户可选择哪个识别结果对于接收到的笔迹是正确的。然而,替换的传统表示不能处理电子墨水的复杂表示。例如,替换的传统表示局限于分析电子墨水的单个线条。计算系统不说明在任何给定的线条外扩展的电子墨水的上下文值。需要一种用于表示替换以及把它们与墨水的整个树结构关联的改进的解析系统和过程。专利技术概要本专利技术的各方面处理以上描述的问题中的一个或多个,因此提供一种处理来自识别系统的替换的方式。附图简述本专利技术由例子所说明并且不局限于附图,在附图中相似的编号表明相似的元素,其中附图说明图1A示出了通用数字化计算环境的示意图,在其中可实现本专利技术的某些方面;图1B到1M展示了通用计算机环境,该环境支持本专利技术的一个或多个方面。图2展示了符合本专利技术的多个方面的平板计算机的说明性例子。图3展示了符合本专利技术的多个方面的电子墨水的例子。图4展示了符合本专利技术的多个方面的上下文树的说明性例子。图5展示了符合本专利技术的多个方面的网格的例子。图6-7展示了符合本专利技术的多个方面的选择网格。图8-9展示了符合本专利技术的多个方面的网格。图10展示了符合本专利技术的多个方面的对象关系。图11展示了符合本专利技术的多个方面的用于创建网格的说明性过程。图12A-16以及18展示了符合本专利技术的多个方面的上下文树以及替换。图17展示了符合本专利技术的多个方面的电子墨水。专利技术的详细描述本专利技术的各方面涉及识别和处理电子墨水的替换表示。各方面包括将替换分析结果表示为树的一部分。本说明书被分成几个部分以帮助读者。这些部分包括综述、墨水的特征、术语、通用计算环境、替换的表示、对象和对象关系、应用程序编程接口、网格创建、以及例子。注意的是以下描述中的多个连接是在元素之间被说明的。注意的是这些连接除非被指定,否则一般可以是直接的或间接的,并且该指定不是要限制于这方面。综述根据本专利技术的多个例子,文档的内容可被排列成树结构。树结构可包括电子墨水和墨水的文本表示。树也可包括非墨水内容,包括但不局限于天然文本、从墨水中识别的文本、从语音中识别的文本、图画、照片、图表、演示、电子数据表、数学公式、音符、音频和/或视频剪辑、以及其他信息。由于文本表示可基于上下文和人们的笔迹的清晰度而变化,文本的替换表示也可被包括在树结构中。本专利技术的各方面包括通过使用具有替换识别结果的一个或多个网格的树结构的表示。通过使用树结构,软件操作系统或应用程序可容易地遍历树结构并且当需要时可获得替换。树结构可定义文档内的各种元素。例如,数据结构内的节点可对应一墨水笔画,并可进一步把该墨水笔划分类成文本墨水笔画或图画墨水笔画。此类数据结构也可把文档元素关联到诸如单词、线以及图形的有意义的组。如此,如果软件应用维护描述手写电子墨水的段落的树结构,那么节点叶可把电子墨水的单个笔画与对应于段落内单词的单词节点关联。然后,树结构可把单词节点与对应于段落内的行的行节点关联。然后,每个行节点可被关联到对应于段落的节点。此外,软件操作系统或应用程序可维护把对应于电子墨水笔画的节点与识别结果关联的树或其他数据结构。如此,这些数据结构可被用以定义关联的电子墨水笔画之间的关系以及改进墨水的替换识别结果的处理。如以下描述的,这些数据结构可根据本专利技术的多个例子与墨水分析工具一起被用以分析文档中的电子墨水。根据本专利技术的多个例子,软件操作系统或应用程序可通过首先创建用于文档的数据结构来获取文档内电子墨水的分析。数据结构描述已经被分析的文档元素中间的关系,并且如此提供上下文,新的电子墨水将在该上下文中被分析。该数据结构或“墨水分析器对象”也包括没有被分析的新的电子墨水。也就是说,墨水分析器对象也包括这样的电子墨水,用于该墨水与其他文档元素之间的关系还没有被建立。在接收到的墨水上至少可执行两个操作。第一个操作是解析接收到的墨水以及创建树结构的解析过程。第二个操作是识别电子墨水以及创建来自树结构的网格的识别过程,并且该网格包括电子墨水的替换识别。其他操作也可在接收到的墨水上执行并且不局限于在此描述的解析和识别过程。例如,解析确定笔画的本地分组。识别确定笔画表示的是语言(或形状或其他类型的数据)内的哪些单词。识别替换也可与网格关联并与父文档或其他文件一起转发。或者,网格和替换的识别结果可在每个计算系统上被重新创建。允许网格和识别结果在机器之间交换的一个优点是墨水与先前获取的信息从一机器到另一机器的持久性。在此,由于替换识别结果已经被关联到网格,第二机器不需要请求来自识别器的新的结果。因此,网格和替换一旦存在,那么它们可结合识别器或不结合识别器而被用在机器上。该能力可进一步支持识别结果对于所有机器的扩展性,而与后续机器是否具有识别墨水或其他输入的能力无关。网格元素可以是在存储(或至少引用)数据的网格内的实体。网格元素内的数据不被限制于文本。网格元素可包括或引用许多可识别的实体,包括但不局限于识别的墨水、未识别的墨水、打字输入的文本、数学公式、音符等。例如,如果一个人在使用数学识别器,那么元素中的每一个可具有数学XML(等)作为每个元素的值。不同的元素仍可保留特定的笔画以及下一栏,但是数据不局限于纯文本。墨水特性如使用墨水笔的用户所知的,物理墨水(那种使用具有墨水储藏器的钢笔写在纸上的类型)可传达比由线段连结的一连串坐标更多的信息。例如,物理墨水可反映钢笔压力(通过墨水的厚度)、钢笔角度(通过线的形状或曲线段以及离散点周围的墨水的行为)、以及钢笔笔尖的速率(通过直度、线宽、以及随着线或曲线的路线的线宽变化)。进一步的例子包括墨水被吸入纸或其他沉淀墨水的表面的纤维的方式。这些细小的特性也帮助传达以上列出的特征。因为比起使用点之间同一的线宽,这些额外的特征、情绪、个性、强调等更可被立即地传达。电子墨水(或墨水)涉及当用户使用基于触针的输入设备时捕获的电子信息的捕获和显示。电子墨水涉及一系列或任意多组笔画,其中每个笔画由一系列点所组成。笔画可在同一时间被绘制或被收集或在不同的时间和地点为了不同的原因而被绘制或收集。点可通过使用多种包括笛卡尔坐标(X,Y)、极坐标(r,Θ)以及其他本领域已知的已知的技术所表示。电子墨水可包括实际墨水的特性的表示,包括压力、角度、速率、颜色、触针大小、以及墨水不透明度。电子墨水还可包括其他特性,该其他特性包括墨水如何被沉淀到页面上的顺序(对于西方的大多数语言,从左至右然后往下的扫描模式)、时间标记(表明墨水何时被沉淀)、墨水的作者的指示、以及发起设备(墨水被绘制至其上的机器的标识或被用以沉淀墨水的钢笔的标识中的至少一个)以及其他信息。在以上描述的特性中,主要使用笔画暂时的顺序以及作为一连串坐标的笔画。所有这些特性也可被使用。术语 通用计算环境图1A示出了一合适的计算系统环境100的示例,在该环境中可实现本专利技术。计算系统环境100只是一合适的计算环境的一例,而不是要提出对本发本文档来自技高网...

【技术保护点】
一种用于与树结构交互的方法,所述树结构包括涉及电子墨水的信息以及涉及电子墨水的替换识别结果,所述方法包括以下步骤:发送请求至所述树结构以获取来自所述树的替换识别结果,所述请求指定所述树结构内的一个或多个节点;以及接收来自所述树结构内的所述一个或多个节点的替换。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:JN维克安姆JJ特纳RJ敦坎S巴哈塔查雅TH坎纳佩尔ZC斯基拉格伊
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1