当前位置: 首页 > 专利查询>徐洪常专利>正文

一种查字打字同码输入法及其输入装置和应用制造方法及图纸

技术编号:3550423 阅读:429 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种查字打字同码输入法及其输入装置和应用,属电脑和数字化键盘汉字编码技术。本发明专利技术依据字典查字通用部首,把34个不成字部首归类为5种基本笔画,把173个成字部首按读音首字母归类为20种读音首字母,设置个性化字词库。为汉字录入设计四种具体编码方案供人们选用,方案一为简体字版,方案二为繁体字版,二者用于电脑。方案三为简体字版,方案四为繁体字版,二者主要用于手机的汉字录入。方案一、二一字两码,每码确定该字的一个部首的读音首字母或一个基本笔画;方案三、四一字三码,第一、二码与方案一、二的编码规则相同,第三码是每码确定该字的一个成字部首的首笔画或一个基本笔画。方案一和方案三均既可用于电脑打字又可用于电子字典和纸质字典的查字学字。

【技术实现步骤摘要】
一、
本专利技术涉及一种查字打字同码输入法及其输入装置和应用,属计算机和数字化键盘汉字编码技术。二、
技术介绍
目前对电脑汉字录入的研究,有人从代码的优化着手,有人从手写识别终端设备着手,有人从语音识别着手,这些研究都是必要的,也都对改进和普及电脑汉字录入曾经发挥了且正在发挥着重要的作用。这些各自独立的研究成果分别适合于使用电脑的不同群体。但是,目前,有一部分人认为,随着ocr技术的出现和不断改进以及手写识别终端设备的改进,代码输入已不重要,加上已投入使用的输入法达千余种,没有必要再进行新输入法的研究。不过根据笔者研究汉字录入的体会,认为就用电脑撰写稿件来说,绝大多数人是用代码输入,代码输入研究仍大有可为,其理由在于:从适用于大多数人电脑汉字录入的角度来看,笔者认为今后电脑汉字录入的主攻方向是:把代码优化研究和手写识别研究结合起来,寻求一种键位代码输入和手写输入都适用的简便易学好用的方案。也就是说手写并不限于汉字整字书写,它也可以是代码。这一研究主攻方向的基本思路是:手写输入和键位代码输入用同一套简便易学好用的方案。手写输入还是键位代码输入由使用者自由选择。习惯边手写边思考或手指不灵巧的用手写输入,习惯边击键边思考或手指灵巧的用键位代码输入。笔者提出今后电脑汉字录入的主攻方向是“把代码优化研究和手写识别研究结合起来”的观点是基于以下考虑:1.上述思路用于手写输入则可能比整字手写输入更优越,其理由有四:(1)、我们首先应该承认下面的事实,即一部分人之所以不用键位代码输入而采用整字手写输入的主要原因不在于键位代码输入方案难学,而是在于:或是习惯于边手写边思考;或是手指不灵巧,用手指击键输入还不如用手写板方便快捷;或是觉得自己所了解的键位代码输入方案不甚好用,还不如用手写板方便;或是这三方面原因兼而有之。基于这一事实,只要我们能创设出一套易学的手写输入和键位代码输入都觉得好用的代码方案来,则无论习惯于手写输入还是习惯于键位代码输入都会采用该方案。甚至可能会由习惯手写输入改为键位代码输入。(2)、手写用代码输入可完全解决识别率的问题。因为一套好学实用的代码,甚至可以说任何一套能用的代码,其代码符号数量都会控制在100以-->内,几十个代码符号很容易解决识别率问题,何况有现成的计算机早已识别的阿拉伯数字和汉语拼音字母(即26个英文字母)用来做代码符号。(3)、比整字手写输入可以提高输入速度。手写汉字全形输入,虽然不用键位代码,可以像英文输入一样怎么写就怎么输入。不过,即使姑且不论目前技术尚不成熟、存在识别率低的问题,即假设其终端识别设备对行书甚至草书辨认的准确率达100%,由于各个汉字的笔划数不等,最少的只有一笔,最多的有30笔以上,静态汉字平均笔划数为10.98;动态汉字平均笔划数为7.30。而好的代码方案,加之采用“句段输入”,用两个代码(即击键两次)就可输入一个汉字,因而整字输入与代码输入相比有一个录入速度慢的致命缺陷。现行汉字整字输入太慢(笔者试过,在纸上用行书体手写汉字每分钟大都在30字左右,很难超过40字,在手写板上更慢,)。这就是说要想“不用键位代码像英文输入一样怎么写就怎么输入”。再由手写识别终端设备辨识确认录入汉字,其录入速度一般要慢于目前通用的使用代码的各种输入法,而若录入速度要慢于目前通用的各种代码输入法肯定不会被广泛采用。(4)、手写输入在修改文稿时不如代码输入方便。2、根据手机输入的主流是代码输入及手机在我国已经普及、使用电脑的人几乎都使用手机的事实,笔者认为本来电脑的汉字录入和手机的汉字录入二者相通,二者可以通用,至少前两码应该相同。这样人们在使用手机和使用电脑实质上不需掌握两种差异很大的输入法。也就是说,从输入法应对电脑的汉字录入和手机的汉字录入作通盘考虑、使二者可以通用的角度说,电脑汉字录入的主流应该是代码输入。3、据有关资料介绍,目前,中国近5亿部手机中的汉字输入法,90%的市场份额被国外企业割占,国产手机生产企业每年为此支付近百亿元的专利费。而且目前国产汉字输入法软件同国外企业我国手机市场上现有的三大主流手机输入法-T9、字能和iTAP-相比仍存在诸多不足。目前我国政府明确力挺自主研发汉字输入法技术。如果能针对目前的手机键盘提出一种好用的输入法其商业价值非常大。此外,信产部相关官员也指出,除了技术和市场问题,手机汉字输入法也与国家信息安全相关从这个角度说,如果能研究出一种能在电脑和手机通用又十分好用的代码输入法,既可为国家增光,又具有非常大的商业价值。4、具体就代码输入来说,虽说是万“码”奔腾,各种代码输入法分别适合一部分特定的人群使用,具体到目前较为通用的某一种输入法都有优点也有弊端。目前的代码输入法总体上存在如下缺陷:(1)以往编码理论都以重码为弊,追求“一码一字,一字一码”,以无重码为最高目标(纯音码无法避免重码是另一回事)。大多形码方案和音形码方案的编码都尽力避免重码。如“五笔输入法”中的字型区别码和个别字的末笔码为区别码“L”,都是了避免重码。笔者认为应该反弹琵琶有意利用重码,并使其保持在一个适当的“度”的范围内。借此减少码长并保证单字码-->长相等。把其做为保证各个字(词)码长短而相等的一个主要手段。(2)目前通用电脑的输入法的选字键都是由键盘上方的数字键和空格键担当,导致手指移动范围大,不甚适合盲打。笔者认为,有必要设计一种方案,让字母键位增加选字(词)功能,使选字(词)键位下移,选字键位全由字母键位和空格键担当,借此提高打字速度。(3)目前较通用的输入法大都有一个庞大而固定的的字库、词语库,从输入法系统本身的角度说,庞大而固定的字库、词语库,不但耗费大量的系统资源,而且编码时面临两难的选择,要减少甚至避免重码,就要增加码长,要减少码长就要增加重码,导致使用起来很不方便。从用户的角度说,我们知道每个人都有自己的用字集和用字特点,尽管汉字总数有几万个,但每个具体的用户所用汉字和符号一般都在三、四千内(据统计,《毛泽东选集》(1-4卷)只用了2900多个不同的汉字,《鲁迅全集》只用了3100多个不同的汉字),不同的用户面对这庞大而固定的字库、词语库,一方面每个具体的用户大部分都用不着这样庞大而臃肿的字库、词语库,另一方面任何字库词语库无论收入多少字词句都不能覆盖全体用户所用词汇。因此,对于字库、词语库建设的最佳选择是变建庞大而固定的字库词语库为建个性化的字库、词语库。(4)目前用于电脑的通用输入法大都未对电脑的汉字录入和手机的汉字录入作通盘考虑。本来电脑的汉字录入和手机的汉字录入二者相通,二者可以通用,至少应该前两码相同。另外,笔者在查字和电脑打字实践中深感目前通用的各种查字法既有优点又有缺点,如音序法查认识的字可直接翻页选字速度快,但把多音字分列两处、不知声调的字难查、不认识的字没法查;部首法能查不认识的字但速度慢且有时数不准笔画。使用电脑过程中,电脑打字和电脑查字未融合在一起,本来,纸质字典、电子字典、电脑打字三者相通,完全可以用同一种编码方案,让打字程序既具有打字功能又具有查字学字功能,浏览网页和打字时遇到生字新词,用打字程序就可查字,不必再启用查字程序。三、
技术实现思路
基于上述认识,以及为了改进已有技术存在的缺陷,本专利技术提供了一种新型的查字打字同码本文档来自技高网
...

【技术保护点】
一种查字打字同码输入法,其特征是,编码规则如下:(1)按成字部首读音首字母及非成字部首首笔画编码;(2)每字最多三码,第一、二码,成字部首取读音首字母码,不成字构件取首笔笔画码,第三码均取笔画码;第三码或为显性码或为 隐性码,为显性码时,主要用于手机及其他数字键盘的汉字录入;为隐性码时,主要用于查字和电脑的汉字录入;(3)编码时首先把汉字分为独体字和合体字两类,再按下列规则编码:(3.1)独体字取码规则:(3.1.1)成字部首独体 字:第一码为成字部首读音首字母,第二码为成字部首读音首字母;第三码成字部首首笔笔画,第三码按其首笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;(3.1.2)非成字部首独体字:第一码首 笔笔画,第二码次笔笔画,第三码为第三笔笔画,第三码按其首笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;(3.2)合体字编码规则:(3.2.1)两半中均为成字部首或两笔以上非成字部首各自独占一 半的:第一码为独占一半的前半成字部首读音首字母或两笔以上非成字部首首笔画,第二码为独占一半的后半成字部首读音首字母或两笔以上非成字部首首笔画,第三码根据第二码取码,第二码是成字部首的,取成字部首首笔笔画,按其成字部首的首笔笔画“一” “丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;第二码是两笔以上非成字部首首笔画的,笔画取该半次笔笔画,按其笔画““一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;(3.2.2)两半中 有一个成字部首或两笔以上非成字部首独占一半的:第一码为独占一半的前半或后半成字部首读音首字母,或两笔以上非成字部首首笔画;第二码:(a)另一半只有一笔的,取该笔笔画码;(b)另一半中有成字部首构件位于该半前一部分或后一部分的 ,取成字部首读音首字母码;否则则取该半首笔码,成字部首构件位于该半中间的,亦取该半首笔码;第三码根据第二码取码,第二码是成字部首的,取其第二码成字部首的首笔笔画,按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6 ”“7”“8”“9”“0”;第二码是取笔画码的,取余下部分首笔笔画,按其笔画“一”“丨”“丿”“丶”“乛”编码分别对应为“6”...

【技术特征摘要】
1.一种查字打字同码输入法,其特征是,编码规则如下:(1)按成字部首读音首字母及非成字部首首笔画编码;(2)每字最多三码,第一、二码,成字部首取读音首字母码,不成字构件取首笔笔画码,第三码均取笔画码;第三码或为显性码或为隐性码,为显性码时,主要用于手机及其他数字键盘的汉字录入;为隐性码时,主要用于查字和电脑的汉字录入;(3)编码时首先把汉字分为独体字和合体字两类,再按下列规则编码:(3.1)独体字取码规则:(3.1.1)成字部首独体字:第一码为成字部首读音首字母,第二码为成字部首读音首字母;第三码成字部首首笔笔画,第三码按其首笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;(3.1.2)非成字部首独体字:第一码首笔笔画,第二码次笔笔画,第三码为第三笔笔画,第三码按其首笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;(3.2)合体字编码规则:(3.2.1)两半中均为成字部首或两笔以上非成字部首各自独占一半的:第一码为独占一半的前半成字部首读音首字母或两笔以上非成字部首首笔画,第二码为独占一半的后半成字部首读音首字母或两笔以上非成字部首首笔画,第三码根据第二码取码,第二码是成字部首的,取成字部首首笔笔画,按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;第二码是两笔以上非成字部首首笔画的,笔画取该半次笔笔画,按其笔画““一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;(3.2.2)两半中有一个成字部首或两笔以上非成字部首独占一半的:第一码为独占一半的前半或后半成字部首读音首字母,或两笔以上非成字部首首笔画;第二码:(a)另一半只有一笔的,取该笔笔画码;(b)另一半中有成字部首构件位于该半前一部分或后一部分的,取成字部首读音首字母码;否则则取该半首笔码,成字部首构件位于该半中间的,亦取该半首笔码;第三码根据第二码取码,第二码是成字部首的,取其第二码成字部首的首笔笔画,按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;第二码是取笔画码的,取余下部分首笔笔画,按其笔画“一”“丨”“丿”“丶”“乛”编码分别对应为“6”“7”“8”“9”“0”;(3.2.3)两半都不是成字部首或两笔以上非成字部首的各自独占一半的:按笔顺取第一、二码,第一码取前半的首笔画;第二码取后半的首笔画;第三码取后半的次笔笔画,后半只有一笔的,第三码与第二码同;第三码按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;(3.2.4)特殊部首字所属字的编码规则:特殊部首字所属字的定义:按编码规则其首码为特殊部首的;特殊部首字所属字的编码规则:首码为特殊部首码;第二码据去掉部首后余下字形依一般字编码规则取码;第三码取码规则:a.第二码是成字部首的,取其第二码成字部首的首笔笔画;按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;b.第二码是取笔画码的,取余下部分首笔笔画,按其笔画“一”“丨”“丿”“丶”“乛”编码为“1”“2”“3”“4”“5”;c.后半只有一笔的,按其第二码笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;(4)高频字包括“,。/;”四个标点,编码规则:第一码相同字的集合组成一个一级重码字组,分别将30个一级重码字组中使用频率最高的前11个高频字的尾码分别编为空格键、a、e、u、i、o、v、“,”、“。”、“/”、“;”,高频字击键两次便可确定输入;为了有规律的记忆或寻找各个高频字所对应的键位,特规定每个一级重码字组中使用频率最高的3个字分别对应空格、“a”和“;”键,其他字按第一码的首笔画“一丨丿丶乛”的顺序排列,第一码首笔画相同的按使用频率高低的顺序排列;特别规定“纟山竹言亠宀忄木人水扌艹月鱼酉”15个部首,其中“言”包括“讠”,“人”包括“亻”,“水”包括“氵”,各自所属的8个高频字按去掉部首后剩余部分的首笔画“一丨丿丶乛”的顺序排列,其中属成字部首的高频字,即去掉部首无剩余笔画的,排在有剩余笔画高频字的前面;“,。/;”4个标点的编码分别为“,,”、“。。”“//”“;;”;为了保证330个高频字中排序在前200的高频字原则上都包括在内,规定:把首码分别为“h、d、l”的高频字各选10个将其首码分别编为“a、o、/”;把首码分别为“f、v”的高频字各选8个将其首码分别编为“e、n”;(5)多字词语编码规则:三字以上词语的录入,按一字一码的简码录入,编码规则如下:(5.1)运用“三字以上词语简码编码功能键”f3、f4、f5、f6、f7,要输入的是n字词语,先击fn,接着输入该词语简码;或者(5.2)运用上档键:要录入三字以上词语,其首字首码与上档键构成组合键,同时击这两键,接着按一字一码击该词语中间字的首码键,最后再同时击该词语最后一字的首码与上档键,即可录入该词语。2.根据权利要求1所述的一种查字打字同码输入法,其特征是,在上述(3.1.2)非成字部首独体字编码规则中,非成字部首编码规则为:非成字部首的第一、二、三码同为首笔画,第三码按其首笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;(3.2)合体字编码规则中,(1)上中下结构的字按不同分法可分为两个不同成字部首的,成字部首就大不就小;(2)上下或上中下结构的字仅从字形上看,既有相接处又有相离处的,一般从相离处划分为两部分,若无相离处,则可从相接处分为两部分;(3)上中下结构的字其首码只能从上下取码,不能从中间取首码,取第一码后,余下部分从形体上看仍为上中下结构的,第二码亦只能从上部或下部取码;若其首码取的是上部或下部的一个独占一半的成字部首或两笔以上不成字部首,第二码仍同其他合体字一样按笔顺优先从余下部分的上部或下部取成字部首码,余下部分无成字部首的取余下部分的首笔笔画码;若其上部和下部均无独占一半的成字部首或两笔以上不成字部首,第一、二、三码则分别取第一、二、三笔画;(4)两半都无成字部首、也无明显界限的上下结构的字,按独体字编码;(5)左中右结构的字其首码只能从左右取码,左右均为成字部首或两笔以上非成字部首的按笔顺从左部取首码,尾码根据余下部分仍按一般规则取码;(6)难以确定编码的字可有两种编码的容错码。3.根据权利要求2所述的一种查字打字同码输入法,其特征是,包括建立个性化字库、词库、多字词语库,首先,分别建立一个基本的单、双字词语库和一个多字词语库,包括高频字库,作为打字人的假定个性化的字词语句库,打字人以此为基础建立适合自己使用的个性化的单双字词语库和多字词语库,其具体方法是其次,打字人利用计算机wodr的学习记忆功能和微软操作系统的造字功能,在汉字的输入过程中随时可以对机内基本的单双字词语库和多字词语库,进行增删及次序重排;当输入文稿字数达到一定数量或几个月后,可对一级高频字加以调整,即把其中自己使用频率低的字按单字编码划归到所属的二级重码字组,另把该二级重码字组中自己使用频率高的字补充到高频字,高频字调出和调入的字数相等,保持高频字总数不变;对打字时新录入的多字词语,在录入文稿的同时手动加入多字词语库;手动加入多字词语库条目的具体方法是:写录入文稿时,用单字编码输入某个多字词语后,随之选中并按f2键确认,接着按一字一码编码输入并显示该多字词语,该多字词语即收进多字词语库;再者,对于已收进个性化的单双字词语库或字或双字词语在一定时间内未重复使用就自动删去。4.根据权利要求1所述的一种查字打字同码输入法,其特征是,电脑的汉字录入方法如下:(一)句段录入A、除句段首字输入该字两码需再击一键从供选字提示框中选定要录入的字确认录入外,其余要录入的汉字均只输入两个编码,由电脑自动选字;B、该句段汉字编码输入完毕,接着输入标点符号码,该句段即录入完毕,接着再依次类推录入下一句段;直至全部录完该自然段或几个自然段,乃至整篇文稿;再通过参考拼写语法检查提示修改其不正确的地方;C、当所键入的第二码是有标点符号和其他...

【专利技术属性】
技术研发人员:徐洪常
申请(专利权)人:徐洪常
类型:发明
国别省市:37[中国|山东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1