当前位置: 首页 > 专利查询>林宝忠专利>正文

一种汉字音义编码计算机输入方法技术

技术编号:2883070 阅读:204 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种汉字音义编码计算机输入方法,其采用标准的英文输入键盘,所用代码对应英文字母键字母,其特征在于采用音节代码和字义代码相结合构成汉字输入编码,音节代码由汉字的声母代码和韵母代码组成,字义代码根据汉字的组成结构以声母代码、部首代码与笔划代码为基础进行编码,本发明专利技术利用汉字的“音”属性和“义”属性对汉字进行编码,汉字输入编码规范、简单、重码率低,重码率仅为2.9%,记忆量小,易学、易记。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种汉字编码方法,尤其涉及。
技术介绍
目前汉字编码计算机输入法主要有汉语拼音输入法、五笔字型输入法,汉语拼音输入法只利用汉字的“音”属性对汉字进行编码,由于汉字的“音”属性所致,重码率高,很难实现盲打,效率极低,五笔字型输入法,虽然降低了重码率,但是规律不易掌握、记忆量大,难学易忘。
技术实现思路
本专利技术的目的在于克服上述已有技术的不足而提供一种编码规范简单、重码率低、记忆量小,易学、易记的汉字音义编码计算机输入方法。本专利技术的目的可以通过以下技术方案来实现,其采用标准的英文输入键盘,所用代码对应英文字母键字母,其特征在于采用音节代码和字义代码相结合构成汉字输入编码,音节代码由汉字的声母代码和韵母代码组成,字义代码根据汉字的组成结构以声母代码、部首代码与笔划代码为基础进行编码。所述的声母代码和韵母代码为(*后的字母表示以a、o、e为开头的零声母音节)代码 声母韵母A*a aB b ia uaC c uanD d aoE*e eF f anG g angH h iang uangI Zh iJ j ianKk iaoLl inMm ieNn iu0*o o uoPp ouQq eng erRr enSs aiTt ui ue üUCh uVSh uai üeWw eiXx ingYy ong iongZz un所述的部首代码为部首氵艹扌亻钅纟讠忄疒辶宀衤阝礻犭饣攵灬代码o a c e p f q s l x d j b z w r f r所述的笔划代码为笔划种类横竖撇捺点钩折提笔划代码 o e a s c n r z所述的字义代码的编码流程为现设定几个概念母系汉字所有的汉字都称为母系汉字。子系字母系汉字中所包含的部首、汉字称为子系字。游离部分把汉字分为两部分,即游离部分和模糊部分,子系字组成游离部分。模糊部分把汉字分为两部分,即游离部分和模糊部分,模糊部分由按照笔顺排列的笔划组成,不能再从中提取子系字。集成字把从中能够提取子系字的母系汉字称为集成字,集成字分为整分字和准分字。约核字把从中不能够提取子系字的母系汉字称为约核字。整分字是指只包括游离部分的子系字,而不包括模糊部分的笔划的汉字,整分字分为二整分字、三整分字、四整分字……,整分字的数目指所包含子系字的数目。二整分字是指游离部分由两个子系字组成的汉字。三整分字是指游离部分由三个子系字组成的汉字。四整分字是指游离部分由四个子系字组成的汉字。准分字是指既包括游离部分的子系字,又包括模糊部分的笔划的汉字,准分字分为一准分字、二准分字、三准分……,准分字的数目是指所包含的子系字的数目。一准分字是指游离部分由一个子系字组成,还包括模糊部分的笔划的汉字。二准分字是指游离部分由两个子系字组成,还包括模糊部分的笔划的汉字。三准分字是指游离部分由三个子系字组成,还包括模糊部分的笔划的汉字。固有汉字从母系汉字中提取的子系汉字,保持汉字原形的称为固有汉字。还原汉字从母系汉字中提取的子系汉字,发生了蜕变需要进行还原的称为还原汉字。子系字代码是指游离部分的部首代码,固有汉字声母代码,蜕变还原汉字声母代码。字义代码由两个字母组成,约核字的字义代码由首尾笔划代码组成;对于二整分字,有同音字的且同音字是固有汉字,另一个非同音固有汉字是部首的,其字义代码由同音固有汉字的字义代码首字母和部首代码组成;二整分字有同音字的且同音字是固有汉字,另一个非同音固有汉字是汉字的,其字义代码由同音固有汉字的字义代码首字母和非同音汉字的声母代码组成,二整分字有同音字的且同音字是还原汉字,其字义代码由部首代码或子系汉字的声母代码组成,二整分字无同音字的,其字义代码由两个子系字代码组成;三整分字、四整分字……,其字义代码由首尾子系字代码组成;一准分字的字义代码由子系字代码和首笔划代码组成;二准分字、三准分字……的字义代码由首尾子系字代码组成。为了更清楚的说明字义代码的编码流程,以下为字义代码的编码流程表 所述的字义代码的部位排列顺序为游离部分的子系字在前,模糊部分的笔划在后,各个子系字以其在母系汉字中的部位进行前后排列,上、下部以上部为前、下部为后,左、右部以左部为前、右部为后,内、外部以外部为前、内部为后。所述的编码方法中还可以进行简码输入一级简码只取全码的第一个字母为汉字的代码,二级简码只取全码的前两个字母为汉字的代码,三级简码只取全码的前三个字母为汉字的代码。所述的编码方法中还包括词组的编码方法为对于词组的每个汉字,在字义编码时二整同音字,不需二次分,只取二整分字中两个子系字的声母代码或部首代码为义码,(1)、两字词组取每个汉字的词组单字义码为词组代码。(2)、三字词组取前两个汉字的词组单字义码的第一码,再取最后一个字的词组单字义码为词组代码。(3)、四字词组取每个汉字的词组单字义码的第一码为词组代码。(4)、多字词组取前三个汉字和最后一个字的词组单字义码的第一码为词组代码。所述的方法中对重码的处理方法(1)提示行选择法,对重码里的几个汉字进行编号,听到提示音后,利用数字键进行选定;(2)自动取舍法将重码里的最常用的汉字放在前面,听到提示音后,若所需为排在最前面的字,则继续录入,后面的字自动被淘汰,第一个字自动选定;(3)简码输入法重码汉字如果有简码,实行简码输入,可以避免重码;(4)词组输入法重码字若有词组,实行词组输入,可以避免重码。由于本专利技术利用汉字的“音”属性和“义”属性对汉字进行编码,汉字输入编码规范、简单、重码率低,重码率仅为2.9%,记忆量小,易学、易记。具体实施例方式,其采用标准的英文输入键盘,所用代码对应英文字母键字母,其采用音节代码和字义代码相结合构成汉字输入编码,音节代码由汉字的声母代码和韵母代码组成,例如“备”的音节代码为BW,“和”的音节代码为HE,字义代码根据汉字的组成结构以汉字的部首代码与笔划代码为基础进行编码,字义代码由两个字母组成,它是通过对汉字进行还原、重组、分解、排列后取得,字义代码取决于子系汉字的声母代码、部首代码、另辅以笔划代码,字义代码由两个字母组成,这样一个汉字的代码由四个字母组成。母系汉字中的子系字与周围部分的联系有三种状态,间隔状态、接触状态、和交错状态,比如“样”字中的“木”与“羊”为间隔状态;“田”字中的“口”与“十”为接触状态;“重”字为交错状态,“串”字为交措状态,从母系汉字中提取子系字,遵循以下可提原则间隔状态、接触状态下可提,交错状态下不可提,如“革”字只能提取“廿”字,其它部分为交错状态,不能再提取子系字,“成”可提取“戊”字,“虫”可提取“中”字。字义代码的部位排列顺序为游离部分在前,模糊部分在后,各个子系字以其在母系汉字中的部位进行前后排列,上、下部以上部为前、下部为后,左、右部以左部为前、右部为后,内、外部以外部为前、内部为后。根据汉字特点,一般部首在前,汉字在后,例如“克”字宜分为“十”和“兄”,不宜分为“古”和“儿”;“树”字宜分为“木”和“对”,不宜分为“权”和“寸”。对于较复杂的字,要先总分后细分,比如“藏”字总分是上、下结构,下部又是内外结构,外部又分左右结构,所以“藏”一分为“艹、臧”,二分为“艹 、本文档来自技高网...

【技术保护点】
一种汉字音义编码计算机输入方法,其采用标准的英文输入键盘,所用代码对应英文字母键字母,其特征在于采用音节代码和字义代码相结合构成汉字输入编码,音节代码由汉字的声母代码和韵母代码组成,字义代码根据汉字的组成结构以声母代码、部首代码与笔划代码为基础进行编码。

【技术特征摘要】

【专利技术属性】
技术研发人员:林宝忠
申请(专利权)人:林宝忠
类型:发明
国别省市:37[中国|山东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1