当前位置: 首页 > 专利查询>赵延胜专利>正文

利用计算机键盘的拼音汉词编码输入法制造技术

技术编号:2889925 阅读:401 留言:0更新日期:2012-04-11 18:40
拼音汉词编码及其键盘属于汉字信息处理的汉字编码技术领域。本发明专利技术提供了一种在字处理基础上的词句音义汉字编码键盘输入方法。为此,提供了一种新的汉字编码单位“汉词”和“句读”,提供了一种新的汉字编码形式“拼音汉词”和“句言”。汉词、句读、拼音汉词和句言的数学化方法,可以为语言信息处理、汉语信息处理和汉字信息处理提供方法。本发明专利技术在不使用人工选字的前提下,使汉字编码无重码,可以读。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于汉字信息处理领域,主要用于汉字的编码、输入、输出、以及汉语词汇和语句的计算机处理等。汉字小键盘输入方法中,按汉字编码所依据的汉字属性来划分,有形码、音码,形音码、音形码四大类。上述汉字编码方法各有利弊,解决问题也多少不同,各种有关介绍很多,这里就不谈了。它们有三个共同的缺点,一是对重码汉字,普遍使用人工选字,给众多使用者造成不便;二是汉字编码不能象英文词那样方便地输入计算机,给计算机普及带来困难;三是各种汉字编码方法,都不能促进汉字信息处理各种应用问题的解决。例如,由周志农先生专利技术的“自然码输入法”就很有名,主要缺点是自然码的拼音编码方法,使用人工选字解决重码问题,不能象使用英文词一样方便,汉语分词问题没有解决;自然码的形义编码方法,不能为汉字信息处理各种应用问题的解决,提供一个良好的环境。本专利技术的目的是提供一种支撑汉字信息处理各种应用问题解决的、以字处理为基础、词句处理的、没有重码的,可以读的汉字编码(键盘)输入方法。为此,提供一种新的汉字编码单位“汉词”,在汉字信息处理和汉字编码中,汉词可以对中文语料进行穷尽切分;提供一种新的汉字编码形式“赵词”,即“拼音汉词”,赵词在分词连写、可以读、不使用人工选字、输入跟英文词差不多的条件下,使汉字编码没有一个重码;提供一种适宜赵词简码输入的小键盘,以便提供输入速度;赵词全码使用国际通用的标准小键盘。为完成上述目的,本专利技术提供了一种拼音汉词编码的方法,以及适用于拼音汉词编码的键盘,其特殊之处在于包括下述内容1.一种拼音汉词编码及其键盘专用的汉字输入键盘,其特征在于拼音汉词编码及其键盘使用“全码”和“简码”两种键盘,全码键盘无图,简码键盘,即图7;全码和简码,都使用国际通用的标准小键盘,把拼音汉词编码的26个声母、38个韵母、26个节调字母、以及对应的汉语拼音22个声母、38个韵母、4个声调符号,定义在标准键盘的26个英文字母键上;下述的“代替”,都是指把汉语拼音的字母用标准键盘上的英文字母代替;全码和简码的声母相同,zh用y代替,ch用w代替、sh用V代替,跟汉语拼音相比,增加五个“无读音”声母a、i、e、o、u,同英文字母,其它声母也同英文字母,即图2;全码的韵母,全部由二个英文字母构成,er用eh代替、a用al代替、 o用oj代替、e用ef代替、ai用ak代替、ei用ec代替、ao用ag代替、ou用od代替、an用am代替、en同英文字母、ang用at代替、eng用eb代替、ong用oy代替、i用ih代替、ia用il代替、ie用if代替、iao用ig代替、iou用id代替、ian用im代替、in同英文字母、iang用it代替、ing用ib代替、iong用iy代替、u用uh代替、ua用ul代替、uo用uj代替、uai用uk代替、uei用uc代替、uan用um代替、uen用un代替、uang用ut代替、ueng用ub代替、ü用oh代替、üe用of代替、üan用om代替、ün用on代替,把汉语拼音的韵母ê并入韵入韵母ei,用ec代替、把汉语拼音的声母ng,作为韵母使用,用ob代替,跟汉语拼音相比,增加一个“无读音”韵母ot,同英文字母,图3;简码的韵母,全部由一个英文字母构成,er、ia以及全码的无读音韵母ot,都用Q代替、iou用w代替、e同英文字母、üan和uan用R代替、üe和uei用T代替、ian用Y代替、u同英文字母、i同英文字母、o同英文字母、uo用o代替、ün和uen用P代替、a同英文字母、iong和ong用s代替、iang和uang用D代替、en用F代替、eng和ueng用G代替、ang用H代替、an用J代替、ao用k代替、ai用L代替、ei和ê用z代替、ie用x代替、ü和ua用C代替、iao用V代替、ou用B代替、in和ng用N代替、ing和uai用M代替,图3;全码和简码的节调字母相同,阴平用s、t、u、v、w、x、z代替,阳平用m、n、o、p、q、r、z代替,上声用g、h、i、j、k、l、y代替,去声用a、b、c、d、e、f、y代替,图1。2.一种拼音汉词的汉字编码方法,其特征在于,以汉词为汉字编码单位,以拼音汉词和拼音句言为汉字编码形式,以汉词和拼音汉词一对一编码,以句言和拼音汉词为输入单位,以句读和汉词为输出单位的汉字音义编码方法,内容包括1)以汉词和编码句读为汉字编码单位,由一个汉字和二个汉字组成的汉字编码单位,叫作汉字汉词,一个汉字的汉字汉词,叫作“单汉字”,或者叫作“单汉字汉词”,二个汉字的汉字汉词,叫作“双汉字”,或者叫作“双汉字汉词”,不加区别时,统称为“汉词”,汉词的数学定义是c2+c1,式中c=0,1,2,3…正整数,c表示不同汉字的个数,c1表示单汉字汉词的个数,c2表示双汉字汉词的个数;一个汉词只有一个意义,叫作“类属意义”,简称“类义”,汉词类义的数学模型是H1=log2(c2+c1),式中,c>0,H1表示汉词类义的平均信息量,单位是比特,c表示不同汉字的个数,c1表示单汉字汉词类义的个数,c2表示双汉字汉词类义的个数;汉词具有规定的书写形式和意义,汉词之间有空格;由二个汉词组成的汉字编码单位,叫作“编码句读”,又叫作“句读”,句读的汉字编码单位有四种,就是,单汉字+单汉字、单汉字+双汉字、双汉字+单汉字、双汉字+双汉字;2)以拼音汉词和拼音句言为汉字编码形式,拼音汉词编码使用“全码”,又叫作“赵词全码”,“简码”,又叫作“赵词简码”,两种汉字编码形式;全码和简码的声母相同,都是26个b、p、m、f、d、t、n、l、g、k、h、j、q、x、y、w、v、r、z、c、s、a、i、e、o、u,即图2;全码的韵母有38个,是eh、al、oj、ef、ak、ec、ag、od、am、en、at、eb、oy、ih、il、if、ig、id、im、in、it、ib、iy、uh、ul、uj、uk、uc、um、un、ut、ub、oh、of、om、on、ot、ob即图3;简码的韵母有26个,是Q、W、E、R、T、Y、U、I、O、P、A、S、D、F、G、H、J、K、L、Z、X、C、V、B、N、M,即图3;全码和简码的“节调字母”,又叫作“节调”,相同,都是26个,另外,分别还有2个相同的节调字母,阴平节调是s、t、u、v、w、x、z,阳平节调是m、n、o、p、q、r、z,上声节调是g、h、i、j、k、l、y,去声节调是a、b、c、d、e、f、y,即图1;全码和简码分别使用声母、韵母、节调,把汉语拼音有声韵调的不同音节大约1300个,编码为大约8580个有声韵调的不同的编码,这8580个编码,叫作“拼音汉词”,一个声节的拼音汉词,叫作“单声节”,或者叫作“单声节赵词”,二个声节的拼音汉词,叫作“双声节”,或者叫作“双声节赵词”不加区别时,统称为“拼音汉词”或者“赵词”,赵词的数学定义是a2+a1,式中a=0,1,2,3…正整数,a表示不同声节的个数,a1表示单声节赵词的个数,a2表示双声节赵词的个数;一个赵词只有一个标准语音,就是标准普通话语音,赵词普通话语音的数学模型是H2=log2(a2+a1),式中,a>0,H2表示赵词普通话语音的平均信息量,单位是比特,a表示不同声节的个数,a1表示单声节赵词普通话语音本文档来自技高网...

【技术保护点】
一种拼音汉词编码及其键盘专用的汉字输入键盘,其特征在于:拼音汉词编码及其键盘使用“全码”和“简码”两种键盘,全码键盘无图,简码键盘,即图7;全码和简码,都使用国际通用的标准小键盘,把拼音汉词编码的26个声母、38个韵母、26个节调字母、 以及对应的汉语拼音22个声母、38个韵母、4个声调符号,定义在标准键盘的26个英文字母键上;下述的“代替”,都是指把汉语拼音的字母用标准键盘上的英文字母代替;全码和简码的声母相同,zh用y代替,ch用w代替、sh用V代替,跟汉语拼音相比 ,增加五个“无读音”声母a、i、e、o、u,同英文字母,其它声母也同英文字母,即图2;全码的韵母,全部由二个英文字母构成,er用eh代替、a用al代替、o用oj代替、e用ef代替、ai用ak代替、ei用ec代替、ao用ag代替、ou用o d代替、an用am代替、en同英文字母、ang用at代替、eng用eb代替、ong用oy代替、i用ih代替、ia用il代替、ie用if代替、iao用ig代替、iou用id代替、ian用im代替、in同英文字母、iang用it代替、ing用ib代替、iong用iy代替、u用uh代替、ua用ul代替、uo用uj代替、uai用uk代替、uei用uc代替、uan用um代替、uen用un代替、uang用ut代替、ueng用ub代替、ü用oh代替、üe用of代替、üan用om代替、ün用on代替,把汉语拼音的韵母ê并入韵入韵母ei,用ec代替、把汉语拼音的声母ng,作为韵母使用,用ob代替,跟汉语拼音相比,增加一个“无读音”韵母ot,同英文字母,图3:简码的韵母,全部由一个英文字母构成,er、ia以及全码的无读音韵母o t,都用Q代替、iou用w代替、e同英文字母、üan和uan用R代替、üe和uei用T代替、ian用Y代替、u同英文字母、i同英文字母、o同英文字母、uo用o代替、ün和uen用P代替、a同英文字母、iong和ong用s代替、iang和uang用D代替、en用F代替、eng和ueng用G代替、ang用H代替、an用J代替、ao用k代替、ai用L代替、ei和ê用z代替、ie用x代替、ü和ua用C代替、iao用V代替、ou用B代替、in和ng用N代替、ing和uai用M代替,图3;全码和简码的节调字母相同,阴平用s、t、u、v、w、x、z代替,阳平用m、n、o、p、q、r、z代替,上声用g、h、i、j、...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:赵延胜
申请(专利权)人:赵延胜
类型:发明
国别省市:62[中国|甘肃]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1