当前位置: 首页 > 专利查询>余彦中专利>正文

汉语音字输入方案制造技术

技术编号:2888281 阅读:215 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种汉字的计算机编码输入方案,本方案以汉字的声、韵、调、形结合来编码,按“汉字数值化转换序字法”,字取声、韵、调、形,借助字形弥补音化的不足,词取声、韵、调,脱离汉字字形,本发明专利技术可有效地消除重码,且易学、易用。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种汉字的计算机编码输入方法,具体是一种利用汉字的声、韵、调来编码并输入的方案。现有的汉字计算机输入方式,常用的有“五笔字型”和“智能拼音”,“五笔字型”是对汉字结构的拆分来编码,需记忆大量的字根和掌握较复杂的拆字规则,学习起来较为困难。而“智能拼音”是以汉字的拼音方式编码输入,学习虽容易,但重码较多,且给方言地区的人们学习带来不便。本专利技术针对现有汉字编码方法的缺陷,目的是提供一种以汉字声、韵、调相结合编码,借助字形来弥补音化的不足,以字形量化为依据来区分同音字,是易学、易用的汉语音字编码输入方案。本专利技术的技术方案如下本专利技术将音字分为序字和连字两种字体,序字为汉字的转换形式,连字为词语的拼音形式。因字和词都以其声、韵、调或形结合编码输入,故本专利技术对汉语拼音的部分声母、韵母作了替换1.将汉语拼音做声母替换zh-π、ch-ψ、sh-φ、ng-η;做韵母替换ai-v、ei-w、ao-k、ou-f、an-h、en-n、ang-g、eng-η、ia-q、ie-b、iao-d、iu-x、ian-m、in-t、iang-j、ing-p、ua-π、uo-o、uai-ψ、ui-φ、uan-r(üan-r)、un-s(ün-s)、uang-c、ong-z(iong-z)、u-y、ue-l(üe-1);做音节变换a、o、e开头的音节在前面加字母ε并按“韵母替换”写成单字母韵母,儿纯音节在第一个字母之后加符号“”。2.用字母、A、γ作词取码的标调字母,依次表示阴平、阳平、上声,去声不标调,轻声在第一个字母之前加符号“·”。以下是序字和连字的编码方法一、序字,即汉字,采用3-4码输入,第一码为汉字声母,第二码为汉字韵母,第三码为区分汉字形体的六组标调字母中对应的字母,按“汉字数值化转换序字法”确定,第四码为区分汉字形体,按汉字的构件数值,以26为周期来与26个字母对应。1.第一、第二码的两个字母,由汉字的字音来确定(多音字分化为多个序字),轻声在第一个字母之前加符号“·” ,但轻声变读不标明轻声调。2.第三码的字母,采用序字的六组字母标调来区分汉字形体的方法,六组标调字母为第一组为b、p、m、f,第二组为d、t、v、l,第三组为g、k、h、η,第四组为j、q、h y,第五组为z、c、g、w,第六组为χ、ψ、φ、ε,各组字母均依次表示阴平、阳平,上声、去声。3.当出现同音字,在第三码上不能区分时,汉字需取第四码。第四码的字母,汉字取“竖。(“乙”、。 ”笔画计1竖)作为构件数值(每竖为1),其中闭合部件、几个相同(相近)部件的数值与标调数值规则保持一致。其中左右或左中右结构增加10,然后加上无周期的标调数值作为第四个编码字母对应的数值。但是,汉字顶端(左右结构为几个顶端)的“点”和底部(左右结构为几个底部)的“人”、 “メ”、“八”、 增加1(横向部首“火”不增加),无横横向部首(左边)的“竖”左边有“点”增加2。例如艺-7、戈-3、立-s、江-17、夫-s、又-10、双-14、贝-5、熠-26、惧-1、建-12、健-4、筵-7。4.把字母χ、ψ、φ、η、ε变换成罗马字母,其中第一、第三、第四码的字母变换为χ-i、ψ-u、φ-o、η-a、ε-e,第二码的字母变换为χ-q、ψ-b、φ-y、η-l(在声母n、l之后为η-c)、ε-e。本专利技术确定第三码和第四码的“汉字数值化转序字法”如下1.汉字以六为周期来确定标调数值。2.全包围结构汉字无内含的为4(4表示第四组,以下以此类推),有内含的为5。其它字体结构中的闭合部件的数值与闭合结构的标调数值保持一致,如口-4、田-5、目-5。以上闭合部件指的是,按规范印刷字形取大不取小,如“兼”的闭合部件取“由”而不取“田”;“壶”无闭合部件,而“壼”有闭合部件。延伸后能补上缺口的横作为封口构件。3.独体结构汉字的标调数值,无横为1,有横按纵向从上到下取横(包括“提”)作为构件数值(每横为1,按最大数值取构件),高度在首横之上末横之下的部分各加1。例如,人-1、火-1、瓜-1、工-2、十-3、井-6、尹-6、又-5、及-5、臾-1、弗-1、马-4、疋-3、承-5、乘-5、来-4。4.半包围结构汉字的标调数值,两边和三边相拦均为6、但“广”、“户”、“辶”、“疒”构成的半包围结构依次为1、1、2、3(7、7、8、9)。例如贰-6、题-6、凶-6、房-1、通-2。5.上下或上中下结构汉字的标调数值,从上到下按接独体结构取部件数值(按整体来确定首横和末横)。但是,几个部件相同(相近)的时候,合起来作为1;几个部件为横向结构的时候,各个部件的数值为1(相同或相近的时候,合直来作为1);横与横之间的“丷、”、“八”、 “灬”作为1(包括独体结构)。例如吉-1、多-1、莒-3、嘉-5、赢-4、筘-3、菜-6、卒-5、立-4。6.左右或左中右结构汉字的标调数值,从左到右按独体结构(包括纵向结构部件)取部件数值。但是,无横的第一个局部独体结构(部首),取第一竖和其左边的构件(包括局部在左边的构件)数目之和作为部首数值;无横无竖的部首,以构件数目作为部首数值;几个部件相同(相近)的时候,合起来作为1。例如(独体为部首)讠-3、纟-4、虫-2、 --6、亻--2、彳-3、忄-2、丬-3、火-4、豸-1、羽-1、双-1、比-1、淮-3、谐-3。为区分充当单音节词的同音字,本专利技术还需采用标调数值调整原则1.将全包围结构、半包围结构并入其他结构(“左”、“下”半包围结构并入左右结构,“下”半包围按横处理)。例如园/圆-5/5→5/1、近/进-2/2→ 5/2。2.闭合部件按独体结构取部件数值。例如工/供-2/2→ 2/6。3.按结构只取横(提)为构件数值(其中的闭合部件的数值可以作为1)。例如拌/绊-2/2→2/5、著/筑-3/3→4/3。4.按横向只取竖为构件数值(每竖为1,按最大数值取构件)。例如福/浮-1/1→ 4/1。5.纵向结构中数值与部件数目相同的横向局部结构,按独体结构取局部结构的数值。例如俞/箭-5/5→5/1。6.数值为1的几个合并部件,按结构取部件数值。例如色/瑟-2/2→2/4。7.无横的部首按独体结构取部首数值;例如认/仞-4/4→4/3。8.部首右边无横的部件按部首取部件数值。例如捌/扒-5/5→5/6。9.哑音数值即确定第四个编码字母的汉字数值,可以作为标调调整数值(按“1”至“9”仍不能调整的,可以补上空缺作为调整数值)。以上的标调数值和标调调整数值按序数与“汉语音字方案”中序字的六组标调字母相对应,哑音数值按序数与相应序数的罗马字母(哑音字母)相对应,其中的字母a、o、e、i、u依次用字母η、φ、ε、π、ψ来替换。例如kfxh(口)、ytpj(圆)、yibη(-)、rnpb(入)、yuηφ(育)、yiwε(澺)、yifε(檍)。二、词的编码方法为每一个字声母、韵母、声调所对应的码依次相加;用字母“r”、“n”“’”的作标调字母,依次表示阴平,阳平,上声,去声不标,轻声在第一码前加符号“.”;的、地、得、着、了、过依次写成de、di、dε、πe、le、go。词码可以不考虑重码,而由屏幕提示行来加以区分,单字词由字码的第三个字母来区分,多字词由各个字码的第三个本文档来自技高网...

【技术保护点】
一种汉语音字输入方案,其特征在于:1)汉字由3-4码输入,第一码为汉字的声母,第二码为汉字的韵母,第三码为区分汉字形体的六组标调字母对应的字母,按“汉字数值化转换序字法”来确定,第四码为区分汉字形体,按汉字的构件数值,以26为周期来与26个字母对应;其中:①直接采用计算机标准键盘输入;②zh、ch、sh、ng作声母替换为π、Ψ、φ、η;③ai、ei、ao、ou、an、en、ang、eng、ia、ie、iao、iu、ian、in、iang、ing、ua、uo、u ai、ui、uan、üan、un、ün、uang、ong、iong、u、ue、üe作韵母替换为v、w、k、f、h、n、g、η、q、b、d、x、m、t、j、p、π、o、Ψ、φ、r、r、c、s、s、c、z、z、y、l、l;④以a、o、e开头 的音节在前面加字母ε,儿纯音节在第一码之后加符号“:”;⑤第三码、第四码以“汉字数值化转换序字法”为取码规则:Ⅰ、划分六组标调字母为:第一组:b、p、m、f第二组:d、f、v、l第三组:g、k、h、η第四组:j q x y第五组 :z、c、s、w第六组:π、Ψ、φ、ε;各组字母均依次表示阴平、阳平、上声、去声;Ⅱ、汉字以6为周期来确定标调组数;Ⅲ、全包围结构:无内含为第四组,有内含为第五组;Ⅳ、独体字结构:无横为第一组,有横按纵向从上到下取横,作为构 件数值,高度在首横之上末横之下的各加l;Ⅴ、半包围结构:两边和三边相围均为第六组,但“广”、“户”、“辶”、“疒”构成的字依次为第一、第二、第三组;Ⅵ、上、下或上、中、下结构:从上到下按独体字结构取部件数值;几个部件相同或相近的合作 来作为l;几个部件为左右结构的,各部件取l;横与横之间的“*”、“八”、“*”、“灬”取l;Ⅶ、左右或左中右结构;从左到右按独体字结构取组数;无横的第一个局部独体结构,取第一竖和其左边的构件数之和为部件数值;无横无竖的部首,以构件数目作 为部件数值;几个部件相同或相近的,合起来为l;⑦当字母π、Ψ、φ、η、ε为第一、第三、第四码时,变为i、u、o、a、e,为第二码时变换为q、b、y、l、e,其中η在n、l之后为c。...

【技术特征摘要】

【专利技术属性】
技术研发人员:余彦中
申请(专利权)人:余彦中
类型:发明
国别省市:85[中国|重庆]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1