拼形、音相兼容汉字编码方案及键盘制造技术

技术编号:2893606 阅读:228 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了相兼容的拼形、拼音及其他输入方案(包括词),其编码对象为正、繁、简体、异体、异形字,方案中采用了复合字根(传统)或基本字母,字根的映射代码是以字根的读音用二符表示,与标准输入相兼容。拼音、拼形及二者之简码均相兼容。拼音输入法之简码输入可以容忍某些发音不准的输入。本方案简便,大大减少记忆,取字根次序可不按笔顺,减少了冗码,适合于专业、非专业人员广泛使用。本方案也能用于其他汉字处理系统。(*该技术在2007年保护过期,可自由使用*)

【技术实现步骤摘要】
本编码方案属于“汉字编码”
汉字编码是当今汉字输入电脑的主要方法,已有的编码方案很多,大体上分为拚形、拚音、音形结合等几种。拚形方法其编码对象为汉字的形状和构成字根,不考虑读音和意义,但有的拚形方案中,所用部首(字根)有局限性,超出原规定部首不能使用,有的拚形方案中,所用部首虽然简化,但与原来人们掌握的部首不相一致,需另行记忆,比较麻烦。另外,在拚形方法的字根安排上,大多从统计学方法考虑来减少字的二义率,在选择代码时有任意性,与该字根的读法无法相照应等,不容易很快操作。而拚音方案又受到读音的限制,不容易掌握。本专利技术目的是提出拚形、拚音方面输入速度快,减少记忆,好学好用,便于普及也能提高的编码方案。本专利技术是这样达到上述目的的本专利技术提出了一些拚形、拚音相兼容的汉字编码方案及与这些方案相适应的键盘。拚形编码方案是汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本字根,基本字根包括特别好记的传统字根和个别特别形象之新造字根或者是编码用字根的映射代码以该字根的二个拚音字母表示,采用简码时用一个拚音字母,即第一个字母或者是字根的映射代码以该字根的声、韵母来表示,声、韵字母与拚音的声、韵母相同或者是取字根的顺序采用从上到下,从左到右,从高到低,从外到内,不限于按笔划顺序提取或者是采用简码,在取字根时将部分字根省略,不全部取完,或者是上述五种编码方案分别组合成的具有两个、叁、肆个特征的编码方案以及具有全部特征的编码方案。在拚音编码方案中,采用拚音输入或者是二码简码输入或者是二码简码中第一符号是声母,第二符号是韵母,而这些声、韵母是总结古今声、韵母演变规律而确定的,或者是拚音输入时的代码命名采用拚形时的命名,或者是它们这些技术特征之间组合成的方案。词输入时,可采用拚形或拚音法输入,拚音法是取第一字之简码,第二、第三字声码,末字之简码。拚形法是取起始三字之第一字根或结构,末尾字之上端和右方;某些常用词尚可用缩写一码,快速码输入,如P、R、C代表中华人民共和国。输入键盘采用43键,可安排于任何标准字盘。拚形输入法考虑了以下三个问题(1)有什么字根(部首、字元);(2)字根的名称(代码、符号);(3)取字根之次序。有什么字根本方案允许以一个基本字根集输入和复合字根输入,基本字根选用特别好记之传统部首,除个别特别形象之新造字根外,均为《小学生字典》所使用。基本字根有常用字根以及一、丿、丨、フ、金、木、水、火、土、日、月,还收集有牛、马、羊、犭、虫等象形动物,但黾、龟使用频度低,不收,非、比、髟等左右分离者不收,父、方、殳、欠、足、走等可由其他字根上下合成者不收,以减少判别时间,玉、丸、夕、寸等内含点者不收,歹、禾、白、自等单笔在上而易忘者不收。基本字根中包括了一些特别形象的新造字根,有(キ、丰)、(井、 )、(水、 )、( )。复合字根含所有其它主要字典(如《康熙字典》、《中华大字典》、《辞海》、《新华字典》所使用的部首,不管是否常用,如(香)、(黄)、()、(至)、(尤)等。字根越大(笔划越多)则抗书写、异形干扰能力越强,复合字根尚含若干按汉字原形(甲骨文、字见《古文字类编》)之规律而新造之字根,如〔〕、〔莫〕、〔〕、〔〕、〔辛辛〕等(部分选自《说文解字》,以提高输入效率。例如馨 可分别分解为土尸丨丿木日几又土尸丨禾日几又土尸丨香几又土尸丨丿木日殳土尸丨禾日殳土尸丨香殳字根的映射代码(键位布局)实行二符代码,并与拼音输入法一致,如一般字用字根的声母、韵母如金(JN)、木(mu)、火(HO)、土(Tu)、日(RI)、月(VE)所有动物和笔形用字根之象形数字或标点加上其声母,如豸(jI)、乌(N)、鱼(φY)、虫(·C)、·(1D)二(2D)三(3D)一(一H)。当字根占整字一半时,用二符,否则按一符输入。用简码输入时,字根可单符输入,有必要时以第二符输入避免二义。使用范例和 HE(禾)KO(口);HKO和;(丿)M(木)KC(口)晖 RI(日)B(ㄇ)C(车);RBC晕 RI(日)B(ㄇ)CE(车);RBCE休 I(亻)mu(木)们 I(亻)mn(门)束 mu(木)K(口)问 (门)KO(口);MK取字根的顺序是大量统计资料说明,汉字有很强的顶端优势、左边优势、外廓优势、中坐优势、因此,本方案严格按照先上后下,先左后右,先外后内,先高后低,口诀是“整冠纳履 其尾”,即①从字之左上端开始,取第一个字根/结构(整冠)②依次取①所确定的字根/结构所复盖的,位于左边的字根,一直取到字之底部,已被取者不再取(纳履)③若尚有别的冠则重复①②④取字之右边未取之字根( 其尾) ⑤W(围合)字从外到内取字根,从①-④类推 ⑥K(扣合)字从上到下,从高到低取字根。本方法不限于按笔顺取字根。使用上述规则的实例路口止夂口微彳山一儿攵懿士 豆冫心人问门口中丨口臂尸口月丄 十蒯艹月刂简码因不按笔顺,可设计各种简码,提高输入效率。使用实例馨(按士尸)木日几又字根分解)①全码士尸丿木日几又 〔土尸;即唯一〕②左三到底土尸丿日几又木 〔土尸;即唯一〕③左二到底土尸日几又丿木 〔土尸日即唯一〕④头到底土日几又丿木 〔土日几即唯一〕拼音输入法本方案有全码输入和简码输入。拼音方案同时要解决降低二义率、容忍方言和地区语音等问题,要充分一字多音兼容(如“的”字的DI DE)。全码汉字拼音法即按汉语拼音遂符输入,由机器显示对应之汉字,为降低二义率采取以下措施①同音、同声字向按频度排列,提高命中率。②同音字(会异声)之前,收录该音累计使用频度约95%以上的高频字,大大提高命中率。③拼音法输入后,可以但不一定要加0~4以标识5声,进一步提高命中率。简码输入法即将汉语拼音压缩为二符,其目的为①提高输入速度②兼容方言、地区发音差别。简码采用声、韵各一符,其命名方法和拼形方案中处理声母、韵母之方法一致,减低记忆负担,能相互兼容,如“白”在拼音、拼形时均为By。声母取汉语拼音第一符,如KO取K,但ZH、CH、SH分别取Z、C、S,即不区别卷舌与否。这样处理是符合汉语语音规律的,因卷舌声母是唐代以后从西方(西域)引进的。汉语古音中无卷舌声母(有少数例外),保持古音之地区的用户(如吴、闽、 )迄今学北方话仍不好掌握。因此,包括Z,ZH;S,SH;C、CH则能兼容华东、华南广大地区之发音差别。韵母取一符,如以“G”“N”结束者,分别取“G”“H”,如“ANG”、“ENG”、“ONG”、“IANG”、“VANG”“NG”均取“G”,其他韵母取其相似尾音,也是符合汉语规律的,(见汉语音韵讲义)。实施例汉语拼音 南音、古音 简码邦 BANG BONG BG门 MEN MOON MNMEN(鲁音)草 CAO CO CO梁 LIANG LEUNG LG这种做法,能兼容非北京人试图以汉语拼音输入汉字所会犯的大部分错误。词的输入法由拼音、拼形法类推拼音法输入取第一字之简码,第二字,第三字之声码,末字之简码。如2字词中国 ZGGO3字词中国人 ZGGRN4字词天下大同 TNXDTG5字以上词同4字处理本文档来自技高网...

【技术保护点】
一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本字根,基本字根包括特别好记的传统字根和个别特别形象之新造字根。

【技术特征摘要】
1.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本字根,基本字根包括特别好记的传统字根和个别特别形象之新造字根。2.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根的映射代码以该字根的二个拼音字母表示,采用简码时用一个拼音字母,即第一个字母。3.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根的映射代码以该字根的声、韵字母来表示、声、韵字母与拼音的声、韵母相同。4.一种汉字编码方案,其特征在于汉字是按照字根来编码的,其取字根的顺序是从上到下,从左到右,从高到低,从外到内,不限于按笔划顺序提取。5.一种汉字编码方案,其特征在于汉字是按照字根来编码的,采用简码时,字的有些字根可以省略,不必全部取完。6.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本字根,基本字根包括特别好记的传统字根和个别特别形象之新造字根;所用字根的映射代码以该字根的二个拼音字母表示,采用简码时用一个拼音字母,即第一个字母。7.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本字根,基本字根包括特别好记的传统字根和个别特别形象之新造字根;所用字根的映射代码以该字根的声、韵字母来表示声、韵字母与拼音的声、韵母相同。8.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本字根,基本字根包括特别好记的传统字根和个别特别形象之新造字根;取字根的顺序是从上到下,从左到右、从高到低,从外到内,不限于按笔划顺序提取。9.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本字根,基本字根包括特别好记的传统字根和个别特别形象之新造字根;采用简码时,字的有些字根可以省略,不必全部取完。10.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根的映射代码以该字根的二个拼音字母表示,采用简码时用一个拼音字母,即第一个字母,其取字根的顺序是从上到下,从左到右,从高到低,从外到内,不限于按笔划顺序提取。11.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根的映射代码以该字根的二个拼音字母表示,采用简码时用一个拼音字母,即第一个字母,采用简码时,字的有些字根可以省略,不必全部取完。12.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根的映射代码以该字根的声、韵字母来表示,声、韵字母与拼音的声、韵母相同;取字根的顺序是从上到下,从左到右,从高到低,从外到内,不限于按笔划顺序提取。13.一种汉字编码方案,其特征在于汉字是按照字根来编码的,采用简码时,字的有些字根可以省略,不必全部取完;所用字根的映射代码以该字根的声、韵字母来表示,声、韵字母与拼音的声、韵母相同。14.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本字根,基本字根包括特别好记的传统字根和个别特别形象之新造字根;所用字根的映射代码以该字根的二个拼音字母表示,采用简码时用一个拼音字母,即第一个字母;取字根的顺序是从上到下,从左到右,从高到低,从外到内,不限于按笔划顺序来提取。15.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本字根,基本字根包括特别好记的传统字根和个别特别形象之新造字根;所用字根的映射代码以该字根的二个拼音字母表示,采用简码时用一个拼音字母,即第一个字母;采用简码时,字的有些字根可以省略,不必全部提取。16.一种汉字编码方案,其特征在于汉字是按照字根来编码的,所用字根是明朝以来的复合字根或基本...

【专利技术属性】
技术研发人员:黄贤
申请(专利权)人:北京市国家安全局黄贤
类型:发明
国别省市:11[中国|北京]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1