【技术实现步骤摘要】
一种基于汉字形态特征的汉字输入法及汉字输入法系统
[0001]本专利技术涉及计算机
,特别涉及一种汉字输入法及汉字输入法系统。
技术介绍
[0002]目前汉字的解析法有多种,如:五笔解析法、拼音解析法、笔画解析法等,五笔解析法是把所有的汉定都按照一定的规则拆成一些字根,并且将这些字根按类分配到键盘上,输入时需要明确知道各个键位对应哪些字根,懂得如何把汉字拆成五笔字根,因此对使用者要求比较高;拼音解析法虽然无需专门记忆字根,但也要求读音准确,且由于同音字较多,造成选词耗时较大,对于学习拼音有障碍的聋哑人或外国人而言,拼音解析法具有很大的困难;而笔画解析法只要会写,都能输入,但很难提升速度,且笔画识别的正确率也不高。
[0003]基于上述各种解析法存在的问题,本专利技术提出一种解析法,基于汉字的形态特征,并通过汉字的各种形态的有无、数量的判断,使大部分汉字得到有效的解析,得到不同汉字的编码,既能保证较快的输入速度,又无需记忆字根,且无需了解汉字读音。
技术实现思路
[0004]本专利技术要解决的技术 ...
【技术保护点】
【技术特征摘要】
1.一种基于汉字形态特征的汉字输入法,其特征在于:包括下述步骤:S1、接收用户输入的键值串;S2、根据字词解析规则将键值串进行分组,得到键值组,再根据汉字赋值规则进一步依次解析所述键值组中的每个键值所代表的形态特征的类型,各类型形态特征的有无和数量,得到每个键值的解析结果;S3、综合每个键值的解析结果查询字库,得到所有符合解析结果的单字和词组,若查询结果仅有一个单字或一个词组,直接将查询结果键入光标位置,若查询结果有多个单字和/或词组,则列出查询结果中所有单字和/或词组供用户选择。2.根据权利要求1所述的一种基于汉字形态特征的汉字输入法,其特征在于:所述形态特征包括独立笔画、封闭面域、复杂笔画、交叉形态以及十字形态;所述独立笔画是指单个汉字中存在的、独立于其它笔画的笔画,其特点是不与其它笔画相交;判断独立笔画的关键,在于判断该笔画是否与其它笔画相连,若相连,则不能算,不相连,则算;计算独立笔画数采用直接计算,即无独立笔画即赋值0,有1个独立笔画即赋值1,有2个独立笔画即赋值2,依此类推,有n个,就赋值n;所述封闭面域是指单个汉字中由笔画围成的封闭面域,其特点是该面域呈封闭状,与外部隔绝,类型包括一般长方形及其变体,但不包括三角形或者近似三角形;判断封闭面域的关键,在于判断该面域是否封闭,如果封闭,则算,如果不封闭,则不算;计算封闭面域数采用直接计算,无封闭面域即赋值0,有1个封闭面域即赋值1,有2个封闭面域即赋值2,依此类推,有n个,就赋值n;所述复杂笔画是指单个汉字中存在的、由三个或者三个以上汉字基本笔画构成的笔画,其特点是比较复杂,汉字基本笔画包括“点、横、竖、撇、捺”;计算复杂笔画数采用直接计算,无复杂笔画即赋值0,有1个复杂笔画即赋值1,有2个复杂笔画即赋值2,依此类推,有n个,就赋值n;所述交叉形态是指单个汉字中存在的斜向交叉的笔画,包括全斜向交叉、1/2斜向交叉和1/4斜向交叉,判断交叉形态的关键,是判断两个笔画是否相交,且是否为斜向相交,如果都是则算,否则不算;计算交叉形态数计算方式为:无交叉形态即赋值0,有1/4个交叉或1/2个交叉都赋值1,有1个交叉形态即赋值2,依此类推;所述十字形态是指单个汉字中存在的正向交叉的笔画,包括十字交叉、1/2正向交叉和1/4正向交叉,判断交叉形态的关键,是判断两个笔画是否相交,且是否为正向相交,如果都是则算,否则不算;计算十字形态数的计算方式为:无十字形态即赋值0,有1/4十字即赋值1,有1/2十字即赋值2,有1个十字形态即赋值4,依此类推,当有多种拆解方案时,以赋值最高的方案为准,但围合成封闭面域的笔画,不再重复计入十字形态;且:同一个字内的笔画,只能算一遍,不可重复计算;所述形态特征的判断以综合各种字体和手写体考虑,当印刷字体与传统手写体有冲突的,则以手写体为准;各种印刷字体有冲突的,则以楷体为准,其次以宋体为准。3.据权利要求1所述的一种基于汉字形态特征的汉字输入法,其特征在于:所述汉字赋值规则包括类型规则、数量规则、“特征
‑
数值”规则和逻辑判断键规则;所述类型规则是以键值组为单位,使各键值组中每个键值所处的顺序位置对应一形态特征类型;
所述数量规则是为所选键值对应赋予一形态特征的数量;所选键值为数字0
‑
9和英文字母“S”,其中,数字0
‑
9分别表示具有某种形态特征的数量为0
‑
9,英文字母“S”键表示某种形态特征的数量≥10;所述“特征
‑
数值”规则是为所选键值同时对应赋予一形态特征的类型和数量;所选键值为英文字母,包括26个英文字母扣除“Y、N、X、S”四个键后的所有按键值,共22个英文字母键值,其中,“Q、W、E、R、T、U、I、O、P”表示形态特征的类型为独立笔画,数量依次分别为0、1、2、3、4、5、6、7、≥8;“A、D、F、G、H、J、K、L”表示形态特征的类型为封闭面域,数量依次分别为0、1、2、3、4、5、6、7、≥7;“Z、C、V、B、M”表示形态特征的类型为复杂笔画,数量依次分别为0、1、2、3、≥4;所述逻辑判断键规则是为所选键值对应赋予一形态特征的有、无或不确定;所选键值为英文字母,其中,“Y”表示有某一形态特征,“N”表示没有某一形态特征,“X”表示不确定有无某一形态特征。4.根据权利要求1所述的一种基于汉字形态特征的汉字输入法,其特征在于:所述字词解析规则包括常规字词规则和简化字词规则;所述常规字词规则具体是:(11)若所述键值串为5字键值串,解析时是将键值串的5个键值当成一个键值组,用于解析一个单字;(12)若所述键值串为6字键值串,解析时是将键值串每3个键值分为一个键值组,前3键值和后3键值分别用于解析二字词中的一个字;(13)若所述键值串为8字键值串,解析时是将8字键值串分为两个键值组,利用前3键值解析二字词的第一个字,利用后5键值解析二字词的第二个字;(14)若所述键值串为9字键值串,解析时是将键值串每3个键值分为一个键值组,每个键值组用于解析三字词中的一个字;(15)若所述键值串为10字键值串,解析时是将10字键值串平均分为两键值组,前5字键值用于解析二字词中的第一个字,后5字键值用于解析二字词中的第二个字;(16)若所述键值串为11字键值串,解析时是将11字键值串分为三个键值组,利用前3键值解析三字词的第一个字,中3键值解析三字词的第二个字,利用后5键值解析三字词的第三个字;所述简化字词规则具体是:(21)若所述键值串为2~6字键值串,同时考虑采用简化规则解析为二字词;(22)若所述键值串为3~9字键值串,同时考虑采用简化规则解析为三字词;(23)针对3字以上的键值串,同时考虑采用简化规则解析为三字以上的词。5.根据权利要求4所述的一种基于汉字形态特征的汉字输入法,其特征在于:根据所述汉字赋值规则作进一步解析具体是:(A)单字解析规则:针对5字键值串解析一个单字具体包括下述三种情况:a1)、数字为主:即接收的5字键值串为数字0
‑
9或“S”,则采用数量规则解析,即将第一个数值解析为“独立笔画”的赋值,将第二个数值解析为“封闭面域”的赋值,将第三个数值解析为“复杂笔画”的赋值,将第四个数值解析为“交叉形态”的赋值,将第五个数值解析为“十字形态”的赋值;
a2)、字母为主,数字为辅:即接收的5字键值串为3+2形式,前三键值为除“Y”和“N”外的24个字母,后两键值为0
‑
9中的数字,则将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值,将第四个数值解析为“交叉形态”的赋值,将第五个数值解析为“十字形态”的赋值;a3)、纯字母:即接收的5字键值串为3+2形式,前3键值为“特征
‑
数值”键,即扣除“Y、N、X、S”四个键后的所有按键值,共22个英文字母,因此采用“特征
‑
数值”规则进行解析,后2键值为“Y、N、X”,因此采用逻辑判断键规则解析;即将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值;将第四个字母解析为“交叉形态”的有无,将第五个字母解析为“十字形态”的有无;(B)二字词规则:针对6字键值串,利用前3键值和后3键值解析时均采用“特征
‑
数值”规则进行解析,即将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值;针对8字键值串,利用前3键值解析时,是采用“特征
‑
数值”规则进行解析,即将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值;利用后5键值解析时,是采用所述(A)中的a1)、a2)、a3)三种情况进行;针对10字键值串,利用前5字键值或后5字键值解析时均采用所述(A)中的a1)、a2)、a3)三种情况进行;(C)三字词规则:针对9字键值串,利用前3键值、中3键...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。