当前位置: 首页 > 专利查询>惠普公司专利>正文

压缩电子墨迹的方法和装置制造方法及图纸

技术编号:3424111 阅读:203 留言:0更新日期:2012-04-11 18:40
提供一种旨在在手提式平台上对墨迹进行低成本的高压缩处理的有损耗墨迹压缩系统。本发明专利技术检测(101)墨迹中的关键点,然后,对连续关键点之间的删除动态信息的光滑曲线进行重复采样(102)。然后将所述重复采样数据标度(103),使其更加与显示分辨率相匹配。最后,对所述数据进行δ编码(104)和压缩(105),以便存储。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及数据压缩系统,更具体地说,涉及电子墨迹数据的压缩。几种产品支持对电子墨迹形式的手写体信息的捕捉和存储。正如这里所用到的,电子墨迹是一序列墨迹书写笔划,每一笔划是一序列由数字化仪图形输入板以恒定的采样速率所测量的坐标对(x,y)。数字式数字化设备在本技术中是常用的。例如,一台这样的设备具有100Hz的采样频率,坐标对以毫英寸为单位,并由16位整数表示。对于这种举例的设备,原始表示法存储一个典型的手写字大概需要1千字节(kB)的存储容量。对于手提式产品,存储器容量的限制要求对电子墨迹进行数据压缩,以允许存储草稿和笔记中有用的内容。数据压缩系统在先有技术中是常用的,所述系统将数字数据编码为压缩的数字码,并将所述压缩的数字码再解码为原始的数字数据。数据压缩是指试图将数据以一种给定的格式转换为另外一种比原始数据占用空间少的格式的过程。数据压缩系统的目的是要实现节省保存给定的大量数字信息所需的存储量,或减少传输给定大量数据信息体所需的时间。数据压缩系统可以被分为两大类;无损耗型和有损耗型。要成为实用技术,数据压缩系统需要满足一定的准则。无损耗系统应该具有可逆性。为了使无损耗数据压缩系统具有可逆性,它必须能够将被压缩数据再扩展,或解码回到它原始的格式,而没有任何的信息变化或丢失。解码后的数据和原有数据必须一致,并且相互没有区别。在有损耗型数据压缩系统中,只要数据的整体感觉(overallperception)没有改变,可以允许在压缩,解压缩过程中信息的某些变化或丢失。电子墨迹的无损耗压缩是肯定可以的。然而,从只要求把墨迹显示在屏幕上的角度出发,有大量的多余墨迹信息可以被删除。从提供高压缩比的需要来看,有损耗型压缩技术更加适合。数据压缩系统应该提供由数据压缩和解压缩系统与之进行通信的设备所提供和所接受的足够的有关数据速率的性能。电子墨迹应用程序的性能是非常重要的,这是因为一般来说,该电子应用程序是用于具有相对较小的CPU能力的小计算机。如果对于每一笔划必须使用复杂的压缩技术的话,即使是具有更大的计算能力的系统也会比较慢。另外一个数据压缩和解压缩系统设计的重要准则是压缩的效率,一般由压缩比来表示。压缩比一般被定义为非压缩格式的数据量除以压缩格式数据量的比。为了使数据可以被压缩,所述数据必须具有冗余性。压缩效率将决定于压缩方法如何有效地使用输入数据中的冗余性。电子墨迹的应用程序必须兼顾压缩效率与墨迹的退化和性能。由于电子墨迹具有一些供压缩用的冗余源,因此相对高的压缩比是可能的。公开的国际专利申请WO94/03853公开了一种用于电子墨迹压缩的方法和装置,其中为了保持真实度而省去了一些极值点。为了减少连续极值间被存储的点的数量,将测量每一点的局部曲率并将具有低曲率的点删除。这种局部测量将有使在延伸笔划上弯度平缓的墨迹变形的风险,在这种情况下,可能不存在起动所述曲率测量的点,但是累积的曲率足以产生扭结。恒定的采样频率(100Hz)允许捕捉关于笔运动的动态信息。然而,这一采样频率比关于手写的奈奎斯特Nyquist极限高出很多,并且数据可以按照2至4倍下降采样,并仍然保留全部动态信息。动态信息对于签名的验证的是非常重要的,并且在某些手写识别和潦草笔迹的匹配中是有用的。然而,动态信息对于在显示设备上显示墨迹的痕迹是不必要的。在缺省墨迹表示法中使用绝对坐标位置允许笔的位置在连续的10毫秒采样之间的整个范围内变化。这大约高于人手所能达到的最大转动速率两个量级。另外,关键点之间笔的轨迹是平滑的、慢变化的曲线,并因此下一采样点的位置可以采用线性预测法、曲线拟合法或动态模型进行预估。这样,模型和所述模型所产生的偏差一起编码能够提供进一步的压缩,虽然在实际中,产生足于适度省去的密度(重置模型)的关键点。数字化仪和显示器两者的分辨率都明显地低于内部笔数据的标准化的毫英寸的分辨率。减少存储分辨率以与特定的数字化仪/显示器设备相匹配或简单地使用较低的标准化的分辨率(如300点/英寸)提供一些小的额外节省。根据本专利技术,我们提供一种压缩手写体数字表示的尺寸的方法,它包括以下步骤为了检测关键点,检测所述数字表示形式的局部极值(101),所述关键点位于所述手写体曲率高的区域;利用根据所述关键点的多边形近似法对所述数字表示进行重复采样(102),产生重复采样数据。局部极值的检测在计算上是相对廉价的,因此提供一种成本低廉的检测关键点的方法。通过多边形近似的重复采样是一种有效的方法,用来在减少数据点数目的同时又保留了能够足以重构手写体输入的重要的点。在将要描述的实施例中,利用多边形逼近的重复采样包括以下的步骤从沿着所述数字表示法的一部分的第一点到沿着所述数字表示法的所述部分的第二点形成一条直线;沿着数字表示法的一部分在所述第一点和所述第二点之间设置第三点,所述第三点具有距所述直线的最大距离;如果所述最大距离大于极限值,则用从所述第一点到所述第三点的第一直线和从所述第三点到所述第二点的第二直线取代所述直线;如果所述最大距离小于所述极限值,则如果所述直线比最大长度短,则用所述直线取代所述第一点和所述第二点之间所述数字表示部分;如果所述直线比最大长度长,则将在第四点分开所述直线,所述第四点位于所述第一点和所述第二点之间的所述数据表示的所述部分。所述方法还包括以下步骤在定位局部极值之前,对所述数字表示进行低通滤波;消除由所述定位步骤产生的人为产生物;对所述重复采样数据进行再标度,产生再标度数据;对所述再标度数据进行编码,产生编码数据;以及对所述编码数据进行压缩,产生压缩数据。编码的步骤可以包括以下步骤在所述数字化仪上预测下一点的位置,并且对所述下一点的所述预测位置和所述下一点的实际位置之间的偏差进行编码。在将要被描述的实施例中,通过上述所定义的方法对手写体的数字表示法进行解压缩的方法包括以下步骤对所述压缩数据进行扩张,以获得所述编码数据;对所述编码数据进行解码,以获得解码数据;用直线将解码数据内各个独立的点连接。在解压缩期间,解码的步骤可以包括以下步骤识别所述解码数据中的尖点,所述尖点是高曲率的点;以及推导出所述尖点之间的解码数据的每对点之间的插值点。获得插值点的步骤可以包括利用样条平滑法找出所述插值点。尖点可以被定义为其出段对着与入段构成的钝角的点。本专利技术还提供一种计算装置,所述装置包括将手写体输入信号数字化的装置和按照上述所定义的方法将所述手写体输入信号压缩的装置。通过举例,并结合附图所进行的详细的描述可以对本专利技术有更好的了解。附图说明图1是说明本专利技术最佳实施例的压缩部分的逻辑操作的高级流程图。图2是说明关键点检测的逻辑操作的高级流程图。图3说明根据本专利技术的基于极值检测的窗口的例子。图4图示说明典型的具有紧密的x/y极值点的手写体字母。图5说明在对手写体字采样时检测的关键点。图6a图示说明对图5的手写体字进行多边形采样的效果,其中,τ=2而d=56毫英寸。图6b图示说明对图5中的手写体字进行多边形采样的效果,其中,τ=5而d=112毫英寸。图7a显示一条线段上多边形采样的第一迭代。图7b显示一条线段上多边形采样的第二迭代。图8图示说明可能的曲线预测模型。图9是显示本专利技术最佳实施例的解压缩部分的逻辑操作的高级流程图。图10是手写体字符本文档来自技高网...

【技术保护点】
一种压缩手写体的数字表示的尺寸的方法,其特征在于包括下面的步骤: 为了检测关键点而检测所述数字表示中的局部极值(101),所述关键点位于所述手写字的高曲率区域; 根据所述关键点利用多边形逼近的方法对所述数字表示进行重复采样,以产生重复采样数据。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:DE雷诺尔德斯
申请(专利权)人:惠普公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1