当前位置: 首页 > 专利查询>周长河专利>正文

一种计算机和手机的汉字音形输入方法技术

技术编号:23212350 阅读:24 留言:0更新日期:2020-01-31 21:43
一种计算机和手机的汉字音形输入方法,解决了拼音输入法和五笔输入法的痛点:或相同编码的字、词语比率高,要频繁地在屏幕上选字选词语,或要记忆大量字根,学习难,遗忘快,且不能以输入词语为主,影响输入速度。技术方案要点是:一、不为字根专门设置代码,所用代码限制在字的拼音的第一个字母、成字组件(即“字中字”)独立成字时的拼音的第一个字母、预先设置的充当汉字各笔画类型“一”、

A method of inputting Chinese character's phonetic form in computer and mobile phone

【技术实现步骤摘要】
一种计算机和手机的汉字音形输入方法一、
一种计算机和手机的汉字音形输入方法。二、
技术介绍
当前计算机和手机的英文键盘汉字输入方法,最普遍使用,也是使用效果最好的是各类拼音输入法和五笔输入法。拼音输入法简单易学,缺点是相同编码的字、词语比率高,输入字、词语时要频繁地在屏幕上选择,速度慢;五笔输入法相同编码的字比率低,输入字时基本不用在屏幕上选字,缺点是需要记忆大量“字根”的代码,学习难,遗忘快,同时,五笔输入法不能以输入词语为主,阻碍了它输入速度的提高。汉语中常用词语的数量不是常用字可以相比的,五笔输入法如果在系统词语库中装入稍多的词语,会有大量词语的相同编码,输入时就得不断地在屏幕上选字选词语;五笔输入法如果在系统词语库中只装入少量的编码不相同的词语,输入时谁也不知道哪些词语能够输入,输入词语就更加麻烦;所以,五笔输入法实际上只能一个字一个字地输。究其原因,第一,五笔输入法字的全码编码是四个代码,词语的全码编码也是四个代码,使得字和词语的全码编码的代码组成结构差异化小,加上代码数量相同,容易重复;第二,五笔输入法词语的全码编码只四个代码,编码的空间不够,容易造成词语间编码相同;第三,五笔输入法在系统编码表中除了字的一个代码的简码编码外,并没有设置其余字和词语的简码编码,其余简码编码是由系统中的全码编码排序自然产生而让人得以用简码编码输入,这造成了几种简码编码属于同一个字或词语的现象(如98版五笔输入法的“经”字同时有三个编码,即二个简码编码“X”、“XCA”和一个全码编码“XCAG”),影响了简码编码字、词语的数量,同时也造成了这种现象:在同类(前一个或前几个代码相同,或全码编码相同)的全码编码的字或词语中,比较常用的字或词语不能用简码编码输入,反而是不常用的字或词语能用简码编码输入。我们需要专利技术这样的输入法,在英文键盘上输入汉字不用记忆字根的代码,字、词语基本没有相同编码,并以输入词语为主,输入汉语像输入英语一样方便、流畅。三、
技术实现思路
(一)解决的技术问题:本专利技术克服了现有技术中的不足,解决了目前计算机和手机的汉字键盘输入中存在的痛点,即:要么字、词语的相同编码多,输入字、词语时要频繁地在屏幕上选择,输入速度慢,要么需要记忆大量字根的代码,学习难,遗忘快,并且不能以输入词语为主,不能让输入速度进一步提高。(二)解决技术问题采用的技术方案及有益效果第一,不为字根专门设置代码,所用代码限制在字的拼音的第一个字母、成字笔画组件独立成字时的拼音的第一个字母、预先设置的充当汉字各笔画类型“一(横)”、“(提)”、“丨(竖)”、“丿(撇)”、“(捺)”、“丶(点)”、“乙(折——所有带转折弯钩的笔画)”代码的键名英文字母,其中各笔画类型“一”、“丨”、“丿”、“丶”、“乙”的代码尽量选择和其形状有共同特征点的键名英文字母,以便于记忆;这使本输入法几乎没有记忆要求;(注:“成字笔画组件”是独立时能成为一个字的笔画组件,即“字中字”;“笔画组件”以下简称“组件”。)第二,将汉字的各笔画类型“一”、“丨”、“丿”、“丶”、“乙”的代码设置成和汉语拼音中的声母不相同的键名英文字母,同时汉字中的一部分非成字组件的输入以非成字组件开头的笔画的代码为代码,使笔画和组件的代码不主要集中在和汉语拼音中的声母相同的键名英文字母上,而是得以分散到所有二十六个键名英文字母中,为减少字、词语的相同编码创造了条件;第三,本输入法字的全码编码为四个代码,词语的全码编码为六个代码,这使字和词语之间的全码编码不会产生相同编码,又加大了字和词语之间的全码编码代码组成结构的差异化,为词语的简码编码和字的编码不相同创造了条件,同时,词语的全码编码比字的全码编码多二个代码又大大增加了词语的编码容量,大大减少了词语的相同的全码编码;第四,把能改编成简码编码的字和词语的全码编码,都改编成简码编码,词语的简码编码区别字的编码,并且改编成简码编码的字和词语在系统编码表中只保留简码编码,让用户只用简码编码输入,这消除了大量编码的重复,减少了绝大部分编码的代码,也能让用户养成用简码编码输入的习惯,同时,改编时,在同类(前一个或前几个代码相同,或全码编码相同)的全码编码的字或词语中,把代码最少的简码编码分配给最常用的字或词语,以提高用户的输入速度;第五,对于少数的全码编码和别的字的全码编码相同的字(多是冷僻字),本输入法用在字的全码编码后添加一个或二个和全码编码的最后一个代码一样的代码的方法,以和它们同编码的字区别,输入方便快捷。本输入法收入《通用规范汉字表》中除了当今公众的计算机无法输入和显示的字以外的全部汉字,包括同形异音字,能做到所收汉字基本无相同的编码,绝大多数常用的字可以用简码编码输入(本说明的最后附上编码为9246字次的系统编码表,以供验证;另外,本输入法能做到十多万个系统词语基本没有相同编码且绝大多数词语能用简码编码输入,能让用户以词语为主输入汉语,只因篇幅关系没办法提供纸质词语系统编码表)。四、具体实施方式(一)给各笔画类型“一”、“丨”、“丿”、“丶”、“乙”设置代码依据形状和键名字母的共同特征点,将各笔画类型“一”、“丨”、“丿”、“丶”、“乙”的代码设置成和汉语拼音中的声母不相同的键名英文字母:(二)为汉字编制全码编码每字的全码编码为四个代码。1、字的全码编码的第一个代码的获取字的全码编码的第一个代码取字的拼音的第一个字母。如“取”字的拼音的第一个字母是Q,Q就是“取”的全码编码的第一个代码。2、字的全码编码的第二个代码的获取字的全码编码的第二个代码的获取分三种情况:(1)排列型字的第二个代码的获取排列型字是指能够分列的字;字中只要是成字组件、独立的笔画(即不属于某个成字组件一部分的笔画——下同)、独立的非成字组件(即不属于某个成字组件一部分的非成字组件——下同),处在从左到右排列中,都能成为排列型字的列;排列型字的列与列之间不存在按字的结构必须互相连接的笔画,按字的结构必须有笔画互相连接的两个组件不能拆分为列。如“临”字分为“丨”、“丨”、三列;如“顺”字分为“川”、“页”二列,不能分为“丿”、“丨”、“丨”、“页”四列,因为“丿”、“丨”、“丨”不是独立的笔画,它们各是成字组件“川”的一部分;如“非”字只能分为二列,不能分为“丨”、“丨”、四列,因为和“丨”、“丨”和按字的结构必须笔画互相连接。排列型字的第二个代码代表字的按笔顺最先书写的列(以下简称“最先书写列”),其获取分三种情况:(A)最先书写列是个成字组件或是个独立的笔画,就以这个成字组件或这个笔画的代码为字的第二个代码。如“取”字以最先书写列“耳”的代码“E”为第二个代码(“取”字中的“耳”是成字组件,它的代码是它独立成字时的拚音的第一个字母“E”——以下同类情况不再赘述);如“小”字以最先书写列“亅”的代码为第二个代码。(B)最先书写列是个独立的非成字组件,如果这个非成字组件的开头能拆分出一个成字组件来,就以拆分出的成字组件本文档来自技高网
...

【技术保护点】
1.一种计算机和手机的汉字音形输入方法,将汉字的各笔画类型“一(横)”、“

【技术特征摘要】
1.一种计算机和手机的汉字音形输入方法,将汉字的各笔画类型“一(横)”、“(提)”、“丨(竖)”、“丿(撇)”、“(捺)”、“丶(点)”、“乙(折——所有带转折弯钩的笔画)”的代码设置成英文键盘的键名英文字母,依据汉字音形特点给汉字编制英文字母编码,通过在英文键盘上输入编码以输入汉字,同时,利用汉字的全码编码给汉语词语编制编码,通过在英文键盘上输入编码以输入汉语词语,其特征在于,字的全码编码为四个代码,字的全码编码的第一个代码取字的拼音的第一个字母,字的全码编码的第二个代码的获取分为排列型字的第二个代码的获取和层叠型字的第二个代码的获取以及独列独层型字的第二个代码的获取,排列型字的第二个代码代表字的按笔顺最先书写的列(以下简称“最先书写列”),其获取分三种情况,字的最先书写列是个成字笔画组件(“笔画组件”以下简称“组件”)或是个独立的笔画(即不属于某个成字组件一部分的笔画——下同),就以这个成字组件或这个笔画的代码为字的第二个代码,字的最先书写列是个独立的非成字组件(即不属于某个成字组件一部分的非成字组件——下同),如果这个非成字组件的开头能拆分出一个成字组件来,就以拆分出的成字组件的代码代表整个最先书写列,作为字的第二个代码,字的最先书写列是个独立的非成字组件,如果这个非成字组件的开头不能拆分出一个成字组件来,就以这个非成字组件开头的笔画的代码代表整个最先书写列,作为字的第二个代码,层叠型字的第二个代码代表字的按笔顺书写的第一层,其获取分三种情况,字的第一层是个成字组件或是个独立的笔画,就以这个成字组件或这个笔画的代码为字的第二个代码,字的第一层是个独立的非成字组件,如果这个非成字组件的开头能拆分出一个成字组件来,就以拆分出的成字组件的代码代表整个第一层,作为字的第二个代码,字的第一层是个独立的非成字组件,如果这个非成字组件的开头不能拆分出一个成字组件来,就以这个非成字组件开头的笔画的代码代表整个第一层,作为字的第二个代码,独列独层型字的第二个代码的获取分为一般独列独层型字的第二个代码的获取和带有“辶”或“廴”的独列独层型字的第二个代码的获取以及单笔画独列独层型字“一”和“乙”的第二个代码的获取,一般独列独层型字的第二个代码的获取分二种情况,如果字的开头能拆分出一个成字组件,就以拆分出的成字组件的代码为字的第二个代码,如果字的开头不能拆分出一个成字组件,就以字的开头的笔画的代码为字的第二个代码,带有“辶”或“廴”的独列独层型字的第二个代码的获取,是让第二个代码代表字的被“辶”或“廴”包围部分,分三种情况,字的被“辶”或“廴”包围部分是个成字组件,就以这个成字组件的代码为字的第二个代码,字的被“辶”或“廴”包围部分是个非成字组件,如果这个非成字组件的开头能拆分出一个成字组件来,就以拆分出的成字组件的代码代表被“辶”或“廴”包围部分,作为字的第二个代码,字的被“辶”或“廴”包围部分是个非成字组件,如果这个非成字组件的开头不能拆分出一个成字组件来,就以这个非成字组件开头的笔画的代码代表被“辶”或“廴”包围部分,作为字的第二个代码,单笔画独列独层型字“一”和“乙”的第二个代码是取它们笔画的代码,即“一”字的第二个代码取笔画“一(横)”的代码,“乙”字的第二个代码取笔画“乙(横折弯钩)”的代码,字的全码编码的第三个代码的获取分为一般字的第三个代码的获取和减去第二个代码所指代的笔画或组件后只剩下一个笔画的字的第三个代码的获取以及单笔画字“一”和“乙”的第三个代码的获取,一般字的第三个代码从减去第二个代码所指代的笔画或组件后字的剩余部分的开头获取,分三种情况,减去第二个代码所指代的笔画或组件后,字的剩余部分的开头如果是个成字组件,字的第三个代码就以这个成字组件的代码为代码,减去第二个代码所指代的笔画或组件后,字的剩余部分的开头如果不是一个成字组件,但能拆分出一个成字组件来,字的第三个代码就以拆分出的成字组件的代码为代码,减去第二个代码所指代的笔画或组件后,字的剩余部分的开头如果既不是一个成字组...

【专利技术属性】
技术研发人员:周长河
申请(专利权)人:周长河
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1