当前位置: 首页 > 专利查询>赏宝珩专利>正文

汉字“笔画分子”型编码输入方法--简称分子码输入法技术

技术编号:2891832 阅读:243 留言:0更新日期:2012-04-11 18:40
分子码输入法属计算机汉字输入编码技术的一种全形码输入法,(1)提出笔画分子的新概念:任何汉字的各种笔画均可以看成是由一个以上的具有矢量特征的笔画分子所组成,全部汉字的笔画分子矢量共七个,可用米字的七个端点分子矢量表示,称“米字定律”,(2)十个数字码符:笔画码七个[2横尾,3竖首,4横首,5撇,6竖尾,7捺,8点]部件码三个[0(口,口),1(钩),9(交)](3)四位等长码体制,小键盘单手输入,有降重措施,重码2~3字占80%,最多6字占1. 6%,采用半自动选字,等效静态重码率<20%。(4)记忆量约为通用码的1/10~20,有“米”“口”字图助记。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】
汉字“笔画分子”型编码输入方法-简称分子码输入法”,属计算机汉字输入
的一种全形码输入法,有关汉字输入技术的背景文件,著作汉字终端技术入门(周关兴) 人民邮电出版社1992.2计算机常用汉字输入方法(王盼卿) 电子工业出版社1992.10启宏全息码(萧启宏) 电子工业出版社1993.3计算机文字处理与信息管理(吴良占) 杭州大学出版社1990.0通用汉字输入方法及排版系统(邵平凡)浙大科海公司1994.2(一)专利技术的目的专利技术一种易学易用,好记难忘,中外老少,普及适用的汉字输入方法。1.市场概况-面临21世纪前后计算机将普遍进入家庭,如使用汉字信息处理者的年令域扩展至,则市场前景,社会需求量总在数亿人以上。2.瓶颈-前5~10年专利技术的各种汉字输入方法虽功不可灭,但中老年人仍望而生畏,年青人除专业者外,多数宁慢试打拼音,也不想强背,难记易忘的各种键盘表。试想人们为解决拼音输入重音字多,方言多,难普及的缺点,已奋斗了三十余年,提出了三百多种详硕方案迄今仍是多数宁慢试打拼音,则足以说明现行汉输入方法弊端之严重不理想,关键是要解决输入编码的易学,好记,和难忘的这个课题。本专利技术的目即为克服现有技术之不足,解决计算机普及的这个汉字输入瓶颈,以迎接21世纪信息时代的到来。(二)现有技术的简评1.输入编码的难度指标,客观评价某种汉字输入方法的优劣应包含以下指标且应视不同对象各有侧重。(1)输入速率(字/分钟)(2)重码率(静态,动态)(3)平均难度系数D。现行汉字输入法多侧重於解决前两项指标,目标在于专业操作人员。而对第三项指标均按软指标对待,不在严格评估之列,致使普及发展滞缓。而非专业操作人员对第(3)条难度系数D最为重视,也是电脑进入家庭的障碍,提出此项指标目的即在於此。作者明确提出平均难度系数D这个专家怕碰,却又难回避的旋涡。定义D为直观(硬)难度系数Dh及与操作细则,图表记忆方法,取码方法等有关的(软)难度系数Ds的乘积。即D=Dh x Ds(1)式中Dh=AN1 x N2 x N3 x N4(2)N1=码符总数(即输入码需动用的总键数)N2=平均每键的含义数N3=平均每字击键数N4=编码体制加权系数(暂定音码,形码均为1,音形码为1.4)A=码符加权系数(暂定码符可读为1;有序为1,反之为2)直观难度系数Dh能反映键盘记忆难度,而Ds反映取码难度,操作规则记忆难度等。Dh虽不全面反映难度,却能以数字相互比较主要难度部分,有比较鉴别才能促使朝需要和改进的方向发展,因而颇有参考价值,而软Ds值一般难于测算,只能评估。Dh值计算举例1五笔字型(王码)N1=25N2=(200+3x5+4+25)/25=9.76王码有成字根103个,键名根25个,特殊根72个共200个,王码教材只言基本根130个,引自文件P.4.交叉识别码3x5=15个,降重码L,容错码U,F,D,共4个,高频字码25个,共计244个码符含义。N3=4(单字)A=1.4x1.2=1.68约40%字根难读加权(1.4),字根有序(1.2)得Dh=25x9.76x4x1.68=1640计算举例2分子码(赏码)N1=10N2=(10+7+14)/10=3.1赏码有笔画码7个,部件码3个,降重千位数调控码7个,百位调控码14个,N3=4A=1笔画分子码名称均可读,矢量等间隔,代码数字有序。得Dh=10x3.1x4=124几种著名汉字输入编码方法的Dh值的计算结果列於表1注Dh仅为概算值,加权系数又是暂定的,故可按500,1000,1500,2000,2500,粗分档次,相对比较各种汉字输入码的直观难度系数。 (三)比较和简评1.音码-受地域方言,年令等因素限止,颇难普及,加上重音字多达95%以上,二次选择繁重,失去轻松感。现有改进方案对输入速率有长进(300/分钟),以增加Ds为代价,在Dh方面反映不明显,仍以全拼双音流行,就总体上讲音码的Dh值低于形码和音形码,正说明用音码上手操作容易,所增Ds值的代价等于学会拼音文字。2.音形码-可看作是对音码或形码在降重码方面的一种改进码,输入速率可高于形码,Dh值约为音码的5~10倍,因是两种体制的混合产物,故Dh,Ds值相形属最高,然而近几年所推出的音形码专利技术甚多,除表中所列五种之外还有萧码,华码,表形码-等,估计在汉字输入无“难度量化”指标的状况下,参照竞争对象又是Dh值本来就很高了的五笔字型码(王码),则还将有更多的音形码面世。如果是以“通用,普及,高速”为目标,适应计算机进入2~3亿家庭的需要,则专利技术参照对象应是英文,即Dh值应低于200,使之与英文的Dh值143接近,故就此而论音形码相差尚远。3.(全)形码-表1.所列十种形码方案,多数有十年以上历史。所知近年形码专利技术不多,形码的Dh值大小相差30倍,指标性能亦大有差别,由此反映出形码体制的灵活多样性,改进余地潜力很大,发掘中华文化遗产汉字宝库,试与英文比高低,形码希望极大。本专利技术“分子码”即是一个在Dh值较低(124)情况下获得中等重码率的成果的例证,成果的取得是基于对现有技术,码特点的剖析认识和某些概念的更新,这些特点是(1)推广最多的在大陆是五笔字型,台湾是仓颉字母,均为形码,决非偶然,说明推广音码或音形码的困难大于形码。(2)过高的重码率(80-90%)不好应用,四角号码除重字多外(有多达30字以上),取码规则,附则亦繁,属淘汰之列。(3)五键五笔画也是重字多,拆字繁,故每字击键不宜过四,否则Dh值虽低亦难应用。(4)非等长码虽可降低平均击键次数,但多键字易出错,纠错亦难,操作不易规范化,不易被接受,应慎用非等长码。最长为七位的汉字笔形编码法(李码Dh=144)及基本笔画笔顺法(芦码Dh=673),属於这类。(5)现行形码降低重码,简化取码所采用的办法明显趋向两个绝端多数过份依赖拘泥于汉字的200个偏旁部首,致使Dh值起点很高(王码Dh=1640)。少数则完全抛开部首不用,备受重码困扰,Dh值虽低亦无用。(6)宜用标准化101键盘,非标准键盘不能普及,此外有用36键方案,45键方案等也不理想(四)专利技术的说明-分子码原理1.分子码的定义一种运用笔画分子的新概念对汉字进行剖析,编码的方法,简称分子码,属全形码类,基本笔画法,分子码可使汉字各种笔画有序化,便於记忆,简化编码,降低重码。2.笔画分子的定义笔画分子概念任何汉字的各种笔画均可以看成是由一个以上的具有矢量特征的相同的等腰梯形的笔画分子所组成,要点有二(1)任何汉字的笔画均由一个以上相同的等腰梯形的笔画分子所构成(2)等腰梯形的长轴或顶边法线均可赋予矢量标记,故笔画分子在平面空间的角度信息可直接由分子的矢量或其代码表示。3.“米”字定律(1)“米”字形态具有上下辐射左右对称,45度六等分园局的特点(2)全部汉字的笔画分子矢量可以概括为在平面上互差45度的七个不同矢量,可以用米字的七个端点的笔画分子矢量或矢量代码表示,称为汉字的“米字定律”,它使汉字的剖晰,编码,取码科学化,使笔画代码间的关系准确有序化,好记,为简化矢量,节省代码,故令“点”的代码只占用一个码符,而无妨於字形识别。4.笔画分子矢量代码(简称笔画分子码)-采用十个数字码符,数字码符的优点(1)比英文字母好记,易打本文档来自技高网...

【技术保护点】
一种汉字“笔画分子”型编码方法--简称“分子码”,属计算机汉字输入技术领域的一种全形码,它包括:笔画分子概念,汉字的米字定律,十个数字码符,中心线取码法,降重码千位数部首调控,数字参与汉字编码,半自动选码法,本专利技术的特征是所述的笔画分子概念:任何汉字的各种笔画均可以看成是由一个以上的具有矢量特征的,相同的等腰梯形的笔画分子所组成。

【技术特征摘要】

【专利技术属性】
技术研发人员:赏宝珩
申请(专利权)人:赏宝珩
类型:发明
国别省市:33[中国|浙江]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1