当前位置: 首页 > 专利查询>姜国钧专利>正文

一种汉字模糊音编码的输入方法技术

技术编号:2889841 阅读:313 留言:0更新日期:2012-04-11 18:40
一种汉字模糊音编码的输入方法,将汉字声母分为b、p、m、f、h、d、t,n、l、g、k、j、q、x、z、zh、c、ch、s、sh、r和零声母十类,将韵母分为单韵母、复韵母和鼻韵母三类,声韵结合构成三十个模糊音节;汉字输入时,先取其字音所对应的键码,再取独立、可读、最小部件之音所对应的键码,不可读或不可分部件取首笔或末笔音所对应的键码。能克服读音不准的困难,而且码元分配均匀,重码率低,取码规则少,记忆量小,反应速度快。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种能将汉字输入计算机或类似设备的方法。迄今登记的汉字编码的输入方法可分为数字类、拼音类、拼形类、音形类和形音类等五大类型。音形类把拼音和拼形结合起来,以音为主辅之以部件名称等字型的特征信息。表音码输入法就是其中一种。表音码从《新华字典》、《现代汉语词典》检字体系中,提取了常用字、常用字变体形式、偏旁冠盖、生僻字等176个偏旁部首和8个笔画共计184个部首笔画作为基本部件,给部分部件定音,少数部件的键位需要强记,取单字和单字部件的声母的首字母进行编码,取码顺序按书写顺序取头两个或三个部件的音。汉字的结构很有规律,笔画组成小部件,小部件组成大部件,大部件组成单字。取大部件最直观,但由于汉字约70%为形声字,取大部件会造成与字音重复取码,因此表音码需取三个部件以减少重码。取三个部件又遇到取大部件还是小部件的问题,因为大多数汉字只有两个大部件。这样一来,表音码输入法不得不一一定义可取部件并定出多项取码规则有11个需要强记键位的部件,需要记住15个生僻字、25个不能直接读出音的偏旁和22个变体偏旁、119个不拆分的独体字。因而表音码输入法记忆量大、规则多,涉及到中间的部件,反应速度较慢。另外表音码输入法只取单字和部件音的首字母,虽能避免发音不准带来的某些错误,但不能区别边音和鼻音,h和f,送气音和不送气音,码元分配不平均。本专利技术拟研究设计一种能克服上述缺陷的汉字模糊音编码的输入方法,以实现规则少、记忆量小、反应速度快、重码少的目的。为达到上述目的,本专利技术采取的汉字编码的输入方法是将汉字声母分为b、p、m,f、h,d、t,n、l,g、k,j、q、x,z、zh,c、ch,s、sh、r和零声母十类,将韵母分为单韵母、复韵母和鼻韵母三类,声韵结合构成三十个模糊音节。汉字输入时,先取字音所对应的键码,再取独立、可读、最小部件之音所对应的键码,不可读或不可分部件取首笔或末笔音所对应的键码。以上所取键码依次排列组成汉字的输入码。在键盘上依次敲击汉字的输入码即可完成汉字的输入。当出现重码时,加敲数字键。所谓“独立”是指所取部件不与其它部件相交或不完全与其它部件相接,“可读”指所取部件为常用字或定义了音的偏旁,“最小”指所取部件不再与后面的部件和笔画组成可读部件。b、p、m,f、h,d、t,n、l,g、k,j、q、x,z、zh,c、ch,s、sh、r和零声母十类声母分别与键盘上的Q~P、A~;、Z~/各十个键码依次对应。Q~P键码为Q、W、E、R、T、Y、U、I、O、P,A~;键码为A、S、D、F、G、H、J、K、L、;,Z~/键码为Z、X、C、V、B、N、M、,、.、/。单韵母对应Q~P代码,复韵母对应A~;代码,鼻韵母对应Z~/代码。将笔画分为横、竖、撇、点、折五类,竖钩归于竖,其余所有拐弯的笔画归于折,提归于横,捺归于点。定义了30个偏旁部件的读音,如表1。其它可读偏旁部件读字音,不可读部件取首笔或末笔音。表130个偏旁部件的读音 </tables>将“丿”,“女”,“十”,“日”,“足”,“八”,“冫”,“丶”,“金”,“人”,“大”,“宀”,“纟”,“竹”,“又”,“寸”,“水”,“月”,“木”,“小”,“石”21个组字率较高的字或笔画偏旁的音分配在组字率较低的键上(如附图说明图1),需要强记。强记的21个部件中的“足”,“金”,“水”,“木”,“小”,“石”和标示在键上的其它5个部件“禾”,“土”,“火”,“文”,“王”不再拆分。21个字或偏旁部件与键码的对应关系如表2所示。表2 </tables>本专利技术将声母分为十类,韵母分为三类,声韵结合构成三十个模糊音节。将400多个音节模糊化为30个音节后,克服了读音不准的困难,30个音节在键盘上分配较均匀且很有规律,既可减少重码率,又便于记忆;汉字输入时,先取字音所对应的键码,再取独立、可读、最小部件之音所对应的键码,不可读或不可分部件取首笔或末笔音所对应的键码,取码规则少,规范,比取大部件反应速度快;只需调整21个部件的键位,就可使得部件音所对应的键码在键上的分配相当平均,且记忆量小。因而本专利技术提供的汉字编码的输入方法科学合理,易学易记易用,并可实现高速输入。下面根据附图和实施例对本专利技术作进一步详细说明。图1为码元分配图。常用单字(约4000个,其中一部分与难字重复)使用三键输入。第一键取单字字音所对应的键码;第二键取按笔顺第一个独立、可读、最小部件的音或不可读部件、分不出部件的首笔音所对应的键码,全包围和半包围结构的字,包围部分先起笔的先外后内,包围部分后起笔的先内后外;第三键取最后一个独立、可读、最小部件的音或不可读部件、分不出部件的末笔音所对应的键码。重码取数字键。难字(3000常用字以上的字、难读准音的字)使用两键输入。即取首尾两个独立、可读、最小部件的音所对应的键码,不可分独体字取首笔和末笔音所对应的键码。重码取数字键。双字词使用四键输入。每字两键,取码方法同单字的第一键和第二键。重码取数字键。三字词使用四键输入。取三个字的音和第三字首部件的音所对应的键码,重码取数字键。四字词和四字以上词使用四键输入。取头三个字和最后一字的音所对应的键码。重码取数字键。实施例1单字啊PGG 阿P;G 埃;EH 挨;LH 哎;GS 唉;GH 哀;SA 癌;Z. 皑;AY氨/YE 肮/BY 蔼;KP 矮;OE 艾;KS 碍;Z 爱;JK 隘;;Z 安/;E鞍/VE 俺/FC 按/LE 暗/TT 岸/.R 案/,M 昂/T; 盎//Z澳;VH奥;WH 懊;NH 凹;OX 敖;X/ 熬;;V 翱/AA 袄;PH 傲;F/实施例2难字瑷BK 廒BP 灞VB 鞴V/ 滗VA 窆;U 豳.A 檗OM瓿RP实施例3词组元极/;YM 模糊QMWI 科学TWHI元音码//QO 中华民族MSZU 振兴中华民族MNMU权利要求1.,包括将笔画分为横、竖、撇、点、折五类,提归于横,竖钩归于竖,捺归于点,其余所有拐弯的笔画归于折,其特征在于将汉字声母分为b、p、m,f、h,d、t,n、l,g、k,j、q、x,z、zh,c、ch,s、sh、r和零声母十类,将韵母分为单韵母、复韵母和鼻韵母三类,声韵结合构成三十个模糊音节;汉字输入时,先取其字音所对应的键码,再取独立、可读、最小部件之音所对应的键码,不可读或不可分部件取首笔或末笔音所对应的键码。2.根据权利要求1所述的方法,其特征在于 b、p、m,f、h,d、t,n、l,g、k,j、q、x,z、zh,c、ch,s、sh、r和零声母十类声母分别与键盘上的Q~;P、A~;、Z~/各十个键码依次对应,单韵母对应Q~P键码,复韵母对应A~;键码,鼻韵母对应Z~/键码。3.根据权利要求1所述的方法,其特征在于偏旁部件的读音为其它可读偏旁部件取字音,不可读部件取首笔或末笔音。4.根据权利要求1所述的方法,其特征在于“丿”、“女”、“十”、“日”、“足”、“八”、“冫”、“、”、“金”、“人”、“大”、“宀”、“纟”、“竹”、“又”、“寸”、“水”、“月”、“木”、“小”、“石”的音对应的键码为字或偏本文档来自技高网...

【技术保护点】
一种汉字模糊音编码的输入方法,包括将笔画分为横、竖、撇、点、折五类,提归于横,竖钩归于竖,捺归于点,其余所有拐弯的笔画归于折,其特征在于:将汉字声母分为b、p、m,f、h,d、t,n、l,g、k,j、q、x,z、zh,c、ch,s、sh、r和零声母十类,将韵母分为单韵母、复韵母和鼻韵母三类,声韵结合构成三十个模糊音节;汉字输入时,先取其字音所对应的键码,再取独立、可读、最小部件之音所对应的键码,不可读或不可分部件取首笔或末笔音所对应的键码。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:姜国钧
申请(专利权)人:姜国钧
类型:发明
国别省市:43[中国|湖南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1