当前位置: 首页 > 专利查询>微软公司专利>正文

通过m阵列解码和快速图像匹配的笔划定位制造技术

技术编号:2931792 阅读:168 留言:0更新日期:2012-04-11 18:40
描述了当笔尖移过文档时确定笔尖路径的系统和方法。该文档为具有迷宫图案的水印文档,从该迷宫图案中确定编码的位置信息。利用位于笔中的摄像机来捕获图像序列。该笔尖路径是通过对该相应的迷宫图案解码和通过匹配该捕获图像与文档图像来确定的。如果与笔划相关的任何一帧的位置坐标不能根据m-阵列解码决定,那么这些帧被转换然后与文档图像的一个区域相配。一旦至少一帧的位置坐标被确定,其它帧的位置坐标则通过在相邻区域中匹配这些帧而进行确定。

【技术实现步骤摘要】

本专利技术涉及利用一数字笔对介质进行交互。更特别地,本专利技术涉及在与一个或多个表面相互作用期间确定数字笔的位置。
技术介绍
计算机用户习惯于利用鼠标和键盘作为与个人计算机交互的方式。虽然个人计算机对于书面文档提供有若干种优势,但大多数用户继续利用打印纸张完成某些功能。这些功能包括读取并注释书面文档。就注解而言,由于此用户对该打印文档的批注,则此打印文档呈现更大的意义。然而,困难之一是,对于具有批注的打印文档来说,该批注需要输入为电子形式文档。这就要求原始用户或者另一用户费劲地看完这些批注,并将它们输入到个人计算机里。在某些情况下,一用户会扫描这批注和这原文,从而创建一个新建文档。这种多个步骤使打印文档和电子版本文档之间的交互很难在一重复基础进行处理。此外,扫描输入图像通常是不可修正的。可能没有办法从原文中分隔这些批注。这使利用这些批注变得困难。从而,需要一种改进的处理批注的方法。一种捕获手稿信息的技术是借助于一支笔,其位置在书写期间可以被确定。提供这种能力的笔是Anoto公司的Anoto笔。这种笔是通过利用摄象机来捕获以预定图案编码的纸张图像而起作用的。这种图像图案的一个示例如图11所示。此模式使用Anoto笔(Anoto公司制造)确定笔在一张纸上的位置。然而,使用Anoto笔的系统来确定位置有怎样的效率是不清楚的。为了提供高效的确定捕获图像的位置,需要提供一种高效的捕获图像解码的系统。当复查文档时,针对该文档,用户可以通过移动笔尖来注解该文档。此笔尖的路径可以包含多个笔划,其中每个笔划对应于一系列捕获图像。因此,在本行业中真正需要识别笔的路径以便对文档进行处理。
技术实现思路
本专利技术的各方面提供了当笔尖横移过文档时测定笔尖路径的系统和方法。对于本专利技术的一方面来说,文档用迷宫图案(maze pattern)加水印,根据该迷宫图案确定编码位置信息。本专利技术的另一方面,通过位于笔中的摄影机来捕获一序列的图像。笔尖路径是通过对相关迷宫图案(m-阵列)解码和通过将捕获的图像与文档图像进行匹配来确定的。本专利技术的另一个方面,如果与笔画相关的任何帧(对应于一捕获图像)的位置坐标不能根据m-阵列解码确定,那么这些帧被转换并且然后与文档图像的一个区域进行匹配。一旦至少一帧的位置坐标被确定,另外一些帧的位置坐标就可以通过匹配相邻区域中的这些帧来确定。本专利技术的另一方面,笔尖路径(对应于一笔划)是利用一透视变换和校准参数从一帧中心中来映射的。透视变换是从迷宫图案分析中并通过将摄像机捕获的图像与文档图像进行匹配所获得的。附图说明当结合附图阅读本专利技术时,上述概述以及以下优选实施例的详细说明将更容易理解,附图以示例方式包括,而不是对所要求专利技术的限制。图1表示可以用于结合本专利技术实施例的计算机的一般说明。附图2A和2B表示根据本专利技术实施例的一个图像捕获系统和相应的捕获图像。附图3A至3F表示根据本专利技术实施例的各种序列和折叠技术。附图4A至4E表示根据本专利技术实施例的各种编码系统。附图5A至5D表示与根据图4A和4B的编码系统相关的四个可能的合成角。图6表示根据本专利技术实施例的捕获图像部分的旋转。图7表示结合图4A至4E的编码系统使用的各种旋转角。图8表示根据本专利技术实施例用于确定捕获阵列位置的过程。图9表示根据本专利技术实施例用于确定捕获图像位置的方法。图10表示根据本专利技术实施例用于确定捕获图像位置的另一种方法。图11表示在根据现有技术文档中编码间隔的表述。图12表示根据本专利技术实施例用于从确定捕获图像中解码提取的比特的一个流程图。图13表示根据本专利技术实施例从捕获图像中提取比特的比特选择。图14表示根据本专利技术实施例用于从捕获图像中解码提取的比特的一个装置。图15表示根据本专利技术实施例用于从捕获帧序列中确定笔尖路径的一种方法。图16表示根据本专利技术实施例用于从捕获帧序列中确定笔尖路径的一个装置。图17表示根据本专利技术一个实施例的捕获图像的一个示例。图18表示根据本专利技术一个实施例的包含文本成分的捕获图像的一个示例。图19表示根据本专利技术一个实施例的捕获图像的一个迷宫图案分析。图20表示根据本专利技术的一个实施例,包含文本成分的捕获图像的一个迷宫图案分析。图21表示根据本专利技术的一个实施例,分析文档图像的一个结果。图22表示根据本专利技术的一个实施例,用于一个典型笔划的全局定位结果。图23表示根据本专利技术的一个实施例,用于一个典型笔划的局部定位结果。图24表示根据本专利技术的一个实施例,重新获得的笔尖笔划和对应捕获图像中心的路径。图25表示对应于图24所示的重新获得的笔划的一个实际笔划。具体实施例方式本专利技术的一些方面涉及确定与较大图像有关的一个捕获图像的位置。在此描述的位置确定方法和系统可以结合多功能笔使用。以下内容以副标题分隔以便于读者得益。副标题包括术语、通用计算机、图像捕获笔、阵列编码、解码、纠错、位置确定、m-阵列解码、和用于确定笔的路径的体系结构。术语笔(Pen)-可以包括或者不包括能够存储墨水的任何写入工具。在某些例子中,根据本专利技术的实施例,没有墨水能力的可以用作笔使用。摄像机(Camera)-可以从纸张或者任何其他介质中捕获图像的一种图像捕获系统。通用计算机图1是常规通用数字计算环境示例的功能方块图,该数字计算环境可用来实现本专利技术的多种方式。在图1中,计算机100包括处理单元110、系统存储器120和系统总线130,系统总线130将包括系统存储器的多种系统部件耦合到处理单元110。系统总线130可以是总线结构类型的任何几种类型,这些总线结构包括存储器总线或者存储控制器、外围总线和利用任何各种总线体系结构的本地总线。系统存储器120包括只读存储器(ROM)140和随机存取存储器(RAM)150。基本输入/输出系统160(BIOS)存储在ROM 140中,包含有助于在计算机100内部元素之间传送信息的基本例行程序,诸如在启动期间。计算机100还包括硬盘驱动器170,用于从硬盘(未显示)读取和写入到硬盘;磁盘驱动器180,用于从可移动磁盘190中读取或者写入到可移动磁盘190;和一个光盘驱动器191,用于从可移动光盘192,诸如CD ROM或者其他光介质中读取或者写入到该可移动光盘192。硬盘驱动器170、磁盘驱动器180和光盘驱动器191分别通过硬盘驱动器接口192、磁盘驱动器接口193和光盘驱动器接口194连接到系统总线130。这些驱动器和其相关的计算机可读介质提供计算机可读指令的非易失存储器、数据结构、程序模块和此个人计算机100的其他数据。本领域技术人员将意识到,在此示例操作环境中也可以使用能够储存计算机可存取数据的其他类型的计算机可读介质,诸如磁带盒、闪存卡、数字视频盘、Bernoulli盒式磁盘、随机存取存储器(RAM)、只读存储器(ROM)等等。很多程序模块能够存储在硬盘驱动器170、磁盘190、光盘192、ROM 140或者RAM 150中,包括操作系统195、一个或多个应用程序196、其他程序模块197和程序数据198。用户能够经由输入设备诸如键盘101和定点设备(pointingdevice)102将命令和信息输入到计算机100里。其他输入设备(未显示)可以包括麦克风、操纵杆、游戏垫、卫星盘(satellite dish)、扫描器等等。这些和本文档来自技高网
...

【技术保护点】
一种用于确定文档内部的笔尖路径的方法,其特征在于,所述方法包含:(A)对与捕获图像相关联的提取的比特解码,以便确定所述捕获图像的位置坐标;(B)响应于(A),如果所述捕获图像的位置坐标不能通过解码确定,则将所述捕获图像与所述文档的图像信息进行匹配;以及(C)将所述笔尖路径从所述捕获图像的位置坐标映射到所述笔尖的位置坐标。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:王坚陈黎勇王强马晓旭党映农
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利