当前位置: 首页 > 专利查询>陈青专利>正文

高度压缩的基于笔划的手写文字处理技术制造技术

技术编号:2884499 阅读:235 留言:0更新日期:2012-04-11 18:40
本发明专利技术一种高度压缩的基于笔划的手写文字处理技术,其特点是:手写字由笔划按书写时的次序组成,其笔划由向量直线和曲线表示,不经识别,直接储存,传送和输出;每个手写字按统一格式进行封装,其封装格式由三段组成,该三段分别为:字头、代码、压缩的笔划。具有不受代码空间约束,无需字库和本地语言系统支持,不需复杂的识别软件,操作容易,没有重码或代码空间不够的问题等优点,可处理任何语言文字。适用于便携通讯设备、网络及移动通讯设备等。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于计算机手写文字信息处理领域。随着技术的迅速发展,手写输入作为一种重要的信息处理技术也得到了全面的发展。手写文字处理的软硬件产品也日益成熟。然而,由于文字尤其是汉字的复杂性,目前的手写字处理技术仍存在着种种的局限,如识别率等。汉字输入作为汉字信息化处理的瓶颈并没有得到完全消除。手写识别是目前作为汉字输入的主要方法之一。使用者在手写设备如触摸屏,手写板上写入文字。手写设备中的识别软件或固化的识别软件根据手写的笔划和笔形由识别算法辨认和确定该文字的内部代码(如GB,BIG5等)。再由手写设备将该代码传送到应用软件或应用设备中。目前识别正确率达到90%以上。手写识别可代替键盘输入。其优点是输入方便迅速,无需学习,但主要问题是对软、硬件资源要求高,成本高,识别率仍不理想等。手写速记主要应用于中文个人数字助理(PDA)中。使用者将汉字书写在触摸屏上。该技术将手写汉字以点阵形式存储于PDA。用户需要时可随时将存储的手写字体读取出来并以同样的点阵显示。该技术不对手写字体作特别的处理,具有速度快读取方便的特点。但速记字只是简单的点阵图形,而不含有更进一步的笔划信息。如恒基伟业商务通速记即为采用此类技术的一例。它具有与手写识别一样的输入方便、无需学习的优点,但缺点是字形质量差。除此之外,以国外为主的厂商还开发了一种称为“墨迹”(Ink)的技术。主要应用于英语及其他西文的手写处理上。主要有微软的RichInk,Marathon PenScript,New Co StrokeMap,CIC QuickNOte Pro等。“墨迹”技术虽采用了笔划压缩的技术,但大都没有以单个字或词为对象(object)和存储单位,也没有采用“字流”方式(一维)的编辑模型。它的功能不仅要支持文字书写,也要支持手写插图。如RichInk,它以每一次手写作为对象和存储单位,手写的文字或图形保留书写时的大小,同时采用面向“纸张”(二维”的编辑模型。大多数“墨迹”技术的产品也利用了矢量技术以提供较高质量的输出结果,但主要问题是由于其兼顾文字和图形,文字编辑(大多不是基于字符流方式)比较麻烦,同时因为其是为西文设计的,故对中文应用不太适合。所有以上技术均没有定义手写字符的可交换格式,不同平台之间无法交换手写文件。对手写文字的压缩处理的现有技术主要有以下几种1.点阵压缩现有大部分对手写文字的压缩采用对点阵图形的压缩。由于为避免字迹的失真,对点阵的分辨率不进行大幅度降低。其结果压缩率低。2.向量化字迹的压缩现有技术也有对手写文字进行向量化处理。但由于采用均匀网格,其结果要么字形严重失真,要么字迹表示数据过大。本专利技术的目的在于使文字处理,特别是文字输入更简单方便,占用资源更少,且更具个性化的特点,并采用动态的非均匀取样网格,达到了以低分率取样网格表示高分辨字迹,字迹扫描数据大幅度减少,而提供的一种高度压缩的基于笔划的手写文字处理技术。实现本专利技术的目的技术的方案是高度压缩的基于笔划的手写文字处理技术,其特点是手写字由笔划按书写时的次序组成,其笔划由向量直线和曲线表示,不经识别,直接储存,传送和输出;每个手写字按统一格式进行封装,其封装格式由三段组成,该三段分别为字头、代码、压缩的笔划。上述高度压缩的基于笔划的手写文字处理技术,其中所述的向量直线由起点和终点连线组成。上述高度压缩的基于笔划的手写文字处理技术,其中所述的起点、终点以网格交叉点为座标。上述高度压缩的基于笔划的手写文字处理技术,其中所述的曲线由起点、数个中间点、终点连线组成。上述高度压缩的基于笔划的手写文字处理技术,其中所述的起点、中间点和终点以网格交叉点为座标。一种用于上述手写文字处理技术的手写字格式的封装方法,其特点是该方法包括①对笔划迹进行向量化和压缩,并以优化的取样网格为座标,不同的手写字采用不同的取样网格;②取样网格信息封装在字头中;③赋予手写字的代码段以实现字符及字段的搜索。一种用于实现上述的手写文字处理技术的操作系统,其特点是包括手写输入设备、应用设备及显示输出设备;所述的手写输入设备包括手写笔及设在应用设备上的手写屏,可将手写笔迹转换成电信号;所述的应用设备以手写字为处理单位,实现应用功能,其内设有手写文字数字化器、存储器、手写文字压缩封装器、手写文字解封解缩器;其中,手写文字数字化器为模数转换器,可将电信号转换成数字信号;存储器用于存储手写字数据;手写文字压缩封装器,将手写笔迹数字信号压缩并封装成手写字;手写文字解封解缩器将封装的“手写字”解封解压缩并还原成可显示图形;所述的显示输出设备用于显示或打印已输入的手写字。上述的操作系统,其中所述的手写字可直接在显示器上显示,也可通过网络传送或接收手写字。用于实现上述的手写文字处理技术的手写文字的压缩和解压缩方法,其特点是所述的压缩方法采用非均匀密度取样网格系统,根据不同的笔迹进行压缩,其步骤包括①对字迹中的笔划进行向量化,同时消除点阵字迹中的冗余信息;②对笔划的密度分布进行分析,并将结果存储在内存工作区内;③根据分析结果计算并选取最佳取样网格,其中笔划较密的区域选用网格较密;笔划较疏的区域选用网格较疏。所述的解压缩方法的步骤为①取样网格信息被读取并被恢复;②笔划数据被读取,并以图形方式绘制在同样的网格上。上述手写文字处理技术的手写文字的压缩和解压缩方法,其中所述的压缩方法中的取样网格由x和y两方向的取样直线组成,x和y方向的取样网格间距由网格的同向大小相对值确定。由于本专利技术采用了以上的技术方案,因此在手写文字输入技术方面避开了汉字的瓶颈,其主要优点有1)手写输入的笔迹不经识别及转换成代码,直接存储、编辑、处理、传输和输出。2)不受代码空间约束。无需字库和本地语言系统支持(如中文系统)。可处理任何语言文字。非常适用于中/日/韩文字处理。避开了汉字输入的瓶颈。3)手写文字几何数据采用先进的压缩技术储存,使之非常适用于便携设备,网络及移动通讯应用。4)手写文字以“字符”为单位进行处理,可象传统文字处理一样进行编辑处理。5)保留笔迹,使文字处理更个性化,更亲切自然。6)不需要复杂的识别软件,大大减少了对硬件资源的需求,从而降低了成本。7)不需要学习和训练,没有重码或者代码空间不够的问题,也不存手写或语音识别中不可避免的识别错误。为进一步了解本专利技术的特征、性能,现结合以下较佳实施例及其附图作详细的描述。附图说明图1为本专利技术的手写文字技术操作系统框图。图2为本专利技术取样网格示意图(其中a图是高分辨率原始手写汉字取样网格示意图;b图为以低分辨率取样网格为坐标的向量直线和曲线表示的同一汉字示意图;c图为对应a图在x方向的网格密度分布图)。图3为本专利技术手写字经输出显示的实施例示意图。图4为本专利技术运行在移动电话通讯系统的实施例示意图。图5为本专利技术运行在计算机的实施例示意图。图6为本专利技术在因特网应用实施例示意图。请结合参阅附图本专利技术的高度压缩的基于笔划的手写文字处理技术,“手写字”以单个汉字为对象(object)和储存单位。手写的笔划迹简称“笔划”。手写字迹不经识别,直接以笔划储存,传送和输出,但仍保留传统文字处理以字符为单位进行处理的特点。“手写字”由笔划按书写时的次序组成。笔划由向量直线和曲线表示。向量直线由起点和终点组成。曲线本文档来自技高网...

【技术保护点】
以向量和曲线表示的手写文字处理技术,其特征在于:由笔划按书写时的次序组成,不经识别,直径以笔划储存、传送和输出;其笔划由向量直线和曲线表示;单个“手写文字”的统一格式进行封装。手写字由笔划按书写时的次序成,其笔划由向量直线和曲线 表示,不经识别,直接储存,传送和输出;每个手写按统一格式进行封装,其封装格式由三段组成,该三段分别为:字头、代码、压缩的笔划。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈青
申请(专利权)人:陈青
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1