通用多功能汉字编码方法及处理系统技术方案

技术编号：2886323 阅读：221 留言：0更新日期：2012-04-11 18:40

通用多功能汉字编码方法及处理系统，一种四位数字汉字编码方法及处理系统，解决汉字的检字、简繁体输入、电脑电话机输入、拼形等采用不同的编码造成人力物力的极大浪费，并且与汉字识字教育不一致引起汉字教育和使用的混乱的问题。按汉字结构切分汉字，按单元（笔形）走向取角，取占角、靠边、两端的笔形为角，分块均衡取码。编码简单、规范、高效、通用，能够满足汉字检索、输入和深入发展汉字处理技术的需要。（*该技术在2019年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种通用多功能汉字编码方法及装置，通用于计算机、电话等设备的汉字输入、检索、排序、汉字拼形字库、汉字文本通讯等各汉字信息处理领域。汉字编码源于汉字的检字法。广泛使用的检字法包括音序检字法、偏旁部首检字法、笔画检字法、四角号码检字法等。五笔字型和仓颉码则分别广泛用于简体和繁体汉字的计算机输入。电话机等只有数字键的设备主要采用笔画编码，辅以拼音(注音)输入。随着汉字处理技术的深入发展，泛字符集汉字的输入和处理也已日益迫切，仓颉码提供了一种汉字拼形解决方法。而汉字的识字教育中一般是合体字教偏旁部首、独体字教笔画顺序。这里的偏旁部首不受键盘的限制，不需要作取舍和归并，能充分反映汉字的结构特征，这使字根部件甚至部首检字法都难以与它取得一致。汉字的检字、简繁体输入、电脑电话机输入、拼形与汉字识字教育等采用不同的编码不但造成了人力物力的极大浪费，而且已经引起了汉字教育和使用的混乱。字根编码采用字母编码，字根众多，难以记忆和使用，在数字键盘上还需额外的映射规则，也不符合汉字使用者单手写字的习惯，因此难以作为通用的汉字编码。采用数字编码的汉字号码输入法如王永民的“简易五笔画输入法”，李金凯的“长城笔形码输入法”，等采用0-9十个数字或其子集按照笔画顺序取码的方法，因特征单元过小，按照笔画顺序取码使各部分取码不均衡，无法反映笔画的空间位置，因此码长较长，且长短不一，重码率很高，无法反映汉字的结构特征。一些笔画编码采用了字首或字尾的概念，如；黄金富的“唯物码汉字输入法”，陈培基的“部首号码输入法”，廖明德(台湾)的“行列输入法”，戚桐欣(台湾)的“中易系统”...

【技术保护点】
通用多功能汉字编码方法及处理系统，采用０－９十个数字或其子集作为编码码元，包括按一定规则对字符进行编码与下列步骤中的一个或多个的组合：１）把字符或映射字符的其它形式按字符编码进行排列，并存储在介质上，２）以物理键盘或模拟键盘、语音、手写等方式输入编码来输入或辅助输入字符信息，３）以传输、存储编码的方式传输、存储字符，４）把字符串的编码与另一字符串的编码或指定编码进行比较，并按比较结果作出标记、修改、输出特定信息等操作，其特征在于：按汉字的结构组成方式对半切分，把汉字分为一到三个单元块；按先上后下、先左后右的顺序排列单元块，同一单元块按单元块或笔形的走向顺序取角编码。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：练新，
申请(专利权)人：练新，
类型：发明
国别省市：35[中国|福建]

全部详细技术资料下载我是这个专利的主人