当前位置: 首页 > 专利查询>兰德康郑珑专利>正文

超大型汉字信息处理装置及方法制造方法及图纸

技术编号:2881410 阅读:210 留言:0更新日期:2012-04-11 18:40
提供一种超大型汉字信息处理装置及方法。该装置包括:汉字输入码接收装置;判断待输入的汉字是否是扩展汉字的判断装置;笫一转换和发送装置,用于在输入的汉字是标准汉字时,将输入码转换为所述汉字的机内码并发送给文字处理模块;第二转换和发送装置,用于在输入的汉字是扩展汉字时,将输入码转换为相应的扩展字库识别码和所述汉字的机内码,然后向文字处理模块发送对应于所述扩展字库识别码的字体设置命令,并且向文字处理模块发送所述机内码。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及汉字信息处理装置及方法,并且更具体地涉及能够处理十万以上汉字的。当前印刷业应用计算机进行汉字输入、编辑、排版、打印输出或发排印前胶片已经很普遍。但是,当处理的字量超过GB2312-80标准的6,763个汉字或是超出GB13000.1标准的21,003个汉字时,目前国内和国外的一些著名的、常用的排版系统都无法处理。比如《康熙字典》的字头字就有47,000多个,在释义部分,还有超出这47,000字的2000多汉字,不但用字量大,而且版式复杂。因此,无论是铅字印刷技术传入中国的100多年以来,还是现代的计算机激光照排技术,都没有解决《康熙字典》按原版式印刷的难题,只能靠照相影印。许多古籍、地方志、人名档案以及大型文献的整理和印刷出版也都如此。可以说,当前计算机印前系统处理的字量不能满足中华5000年文化发展用字的需求。因此,随着信息化进程在各个领域,特别是在大型文献、大型科研文献、古代典藉、户籍造册等领域的加速发展,急需一种能够对两万以上汉字进行输入、编辑、排版和打印的汉字信息处理系统。为解决上述需求,本专利技术的第一个目的是提供一种超大型汉字信息处理装置,它能够方便地处理十万个以上的汉字。本专利技术的第二个目的是提供一种超大型汉字信息处理方法。为实现第一个目的,本专利技术提供一种汉字信息处理装置,其特征在于包括用于接收汉字输入码的接收装置;用于根据输入码判断待输入的汉字是标准汉字还是扩展汉字的判断装置;第一转换和发送装置,用于在所述判断装置判断出所述汉字是标准汉字时,将所述输入码转换为所述汉字的机内码,并将所述机内码发送给文字处理模块;第二转换和发送装置,用于在所述判断装置判断出所述汉字是扩展汉字时,将所述输入码转换为相应的扩展字库识别码和所述汉字的机内码,然后向文字处理模块发送对应于所述扩展字库识别码的字体设置命令,并且向文字处理模块发送所述机内码。为实现第二个目的,本专利技术提供一种汉字信息处理方法,其特征在于包括以下步骤(1)接收汉字输入码;(2)根据输入码判断待输入的汉字是标准汉字还是扩展汉字;(3)如果步骤(2)判断所述汉字是标准汉字,则将所述输入码转换为所述汉字的机内码,并将所述机内码发送给文字处理模块;(4)如果步骤(2)判断所述汉字是扩展汉字,则将所述输入码转换为相应的扩展字库识别码和所述汉字的机内码,然后向文字处理模块发送对应于所述扩展字库识别码的字体设置命令,并且向文字处理模块发送所述机内码。根据本专利技术的装置和方法,能够利用计算机对十万个以上的汉字进入输入、编辑、排版和打印等,从而在需要处理大量汉字的领域中极大地促进计算机的应用。结合附图,通过以下示例方式对本专利技术最佳实施方式的描述,本专利技术的上述和其他目的、特征和优点将会更加明显。附图说明图1是本专利技术的超大型汉字信息处理方法的总流程图;图2是造字系统的流程图;图3是图1中的Microsoft Word 95/97接口管理模块的流程图;图4是图1中的输入法管理模块的流程图;图5示出了本专利技术的汉字信息处理装置的示意结构;以及图6示出本专利技术的汉字信息处理方法的流程图。为解决10万汉字能够在计算机上进行汉字输入、编辑、排版、打印输出或发排印前胶片,就必须有10万汉字库,这是汉字显示、打印的基础。此外,还须有能够输入10万汉字的输入方法,编辑、排版支持系统。因此,必须解决三个关键技术。第一是先进的曲线描述汉字字模的计算机制作系统,即造字系统;第二是能够输入10万汉字的输入方法;第三是能够对10万汉字进行处理的汉字编辑软件。造字系统开发造字系统时,难点在于国外资料仅仅公开了用三次曲线描述英文字母的理论算法,但是没有公开英文造字系统的设计技术。申请人自行设计了曲线汉字算法,完成了计算机造字系统的设计开发,并在使用中不断升级改进。通过该造字系统制作的曲线汉字符合国际通用的TrueType二次曲线的描述格式。每个汉字的轮廓是由若干条Bezier二次曲线和直线组成的,Bezier二次曲线实际上是由起始点、结束点、中间控制点三个点来描述曲线的形状。在这里,将这三个点称为控制点。直线是由起始点、结束点两个控制点描述。造字系统由以下几部分组成1.移动控制点可调节各条轮廓线的曲率,并可伸缩各个笔画的长度、宽度、斜度和曲度;2.对于每种字体,预先要制作几千个大小不等的汉字零部件,然后给每个零部件编入编码(例如,郑码),零部件按编码排序后,就可用编码快速地调用零部件将其拼合成各种不同字体的整字。比如有宋、仿宋、楷、黑等字体;3.在拼字的过程中,可以移动或旋转零部件,并可无极缩放其大小,以调整字体重心的平稳;4.用编码(如郑码)还可调用已经精修的成品汉字,取其某些零部件来拼合新的汉字。由于成品字经过多遍精修,其中的零部件要比初始的单独零部件质量高。这一技术不但使造字效率大大提高,而且最大限度地保证了所造字的精度和美观。汉字输入法在本专利技术的最佳实施方式中,采用郑码作为汉字或汉字零部件的编码,这是因为,作为一种方便、快捷的汉字输入方法,郑码能够对二万以上的汉字以及汉字零部件进行编码,从而可以将二万以上汉字或汉字零部件输入到计算机中。在涉及大字符集的印前制作项目中,郑码输入法已得到广泛应用。当然,如果其他汉字输入法能够对二万以上的汉字以及汉字零部件进行编码的话,也可以采用这样的汉字输入法。汉字编辑软件为了便于用户使用,本专利技术最佳实施方式中,将Microsoft Word作为汉字编辑软件。现有的Microsoft Word 95/97/2000,支持21,003个汉字。在Microsoft Word中,结合True Type字库分页技术,可以利用字体设置命令改变相关汉字的字体。当然,如果其他汉字编辑软件也能够利用True Type中文字库分页技术改变汉字字体的话,也可以采用这样的汉字编辑软件。本专利技术的最佳实施方式,集郑码输入法、10万汉字库、造字系统、Microsoft Word于一体,解决了计算机对10万汉字进行处理的支撑技术,保证10万个汉字能够正确地输入计算机,并根据用户需要得到正确处理。具体地说,本专利技术将Microsoft Word API技术、True Type中文字库分页技术和郑码输入法巧妙地结合在一起,通过超大型汉字输入法管理模块来实现,该超大型汉字输入法管理模块可直接控制Microsoft Word95/97/2000,达到处理10万汉字的输入、输出、排版和电子检索等功能。在一种具体实现中,超大型汉字输入法管理模块由三个部分合成第一部分是输入法功能的设置;第二部分是软键盘输入;第三部分是超大型汉字键盘输入。输入法功能的设置,包括十万/二万切换、中/英文标点切换、全角/半角切换、中英文切换、词语联想、词语输入、逐渐提示、外码提示、光标跟随九项设置,下面一一列举如下1.十万/二万切换用Ctrl+Tab键来切换,当“二万”功能有效时,只输入21003个汉字,否则可输入10万汉字;2.中/英文标点切换键盘Ctrl+.(句号)键切换,在英文标点状态下,所有标点与键盘一一对应。在中文标点状态下,中文标点符号与键盘的对照关系如下“省略号……”对应“^”;“破折号——”对应“-”;“顿号、”对应“/”;“间隔号·”对应“@”;“连接号—”对应“&amp本文档来自技高网...

【技术保护点】
一种汉字信息处理装置,其特征在于包括: 用于接收汉字输入码的接收装置; 用于根据输入码判断待输入的汉字是标准汉字还是扩展汉字的判断装置; 第一转换和发送装置,用于在所述判断装置判断出所述汉字是标准汉字时,将所述输入码转换为所述汉字的机内码,并将所述机内码发送给文字处理模块; 第二转换和发送装置,用于在所述判断装置判断出所述汉字是扩展汉字时,将所述输入码转换为相应的扩展字库识别码和所述汉字的机内码,然后向文字处理模块发送对应于所述扩展字库识别码的字体设置命令,并且向文字处理模块发送所述机内码。

【技术特征摘要】

【专利技术属性】
技术研发人员:蓝德康郑珑
申请(专利权)人:兰德康郑珑
类型:发明
国别省市:HK[中国|香港]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1