当前位置: 首页 > 专利查询>汤建民专利>正文

一种汉字输入方法技术

技术编号:2884734 阅读:254 留言:0更新日期:2012-04-11 18:40
本发明专利技术是采用“札”字五笔画,以及26个英文小写字母作为中文“手写数码”的图形元件;或以“语音数码”,“模糊语音数码”作为汉字的识别信息;通过计算机对上述笔画和字母的字符图形进行联机书写识别,或对汉字的语音及识别数码的(Chinese speech recognition)之简单识别,按规则-转换生成-调用对应的汉字内部码(Chinese character internal code),从而实现中文“海量词语”准确、高效地输入计算机的方法。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】
概念解释中文中国语言文字的简称,特指汉字。手写数码利用计算机键盘区位数字编码,对应汉字双笔形和英文字母的规律,以汉字的基本笔画及英文字母,作为手写图形识别的系统元件;按一定的规则向计算机写入简单的笔画和字母图形,通过对少量简单字符图形的识别转换,形成类似汉字键盘输入的编码和算法,再通过检索汉字编码字、词典查算出汉字内码的“‘中介’图形的数字编码”,称为中文手写数码,简称“手写数码”。语音数码利用计算机键盘区位数字编码,对应汉字双笔形和英文字母对应汉字声-韵-调的规律,以汉字语音及汉字笔画数字代码的语音,作为语音输入的系统元件;按一定的规则,向计算机直接读入汉字语音和笔划的数字语音等,通过对语音识别(频谱分析),转换形成类似汉字键盘输入的编码和算法,再通过检索汉字编码字、词典查算出汉字内码的“‘中介’音频的数字编码”,称为汉字语音数码,简称“语音数码”。模糊语音数码语音数码的特殊形式。识别输入本文特指中文信息处理系统的语音识别输入和手写图形识别输入方法,它是汉字的高速自动输入方式,属于人工智能的范畴;是新一代计算机的视觉、听觉智能接口的重要组成部分。系统方法本文特指计算机汉字的键盘、手写、语音输入等,形成相互作用的、三位一体的输入方法体系。近二十年来,中文信息处理技术取得了丰硕的成果。不少专利技术成果迅速地转变为强大的知识产权力量,又走向市场转化为生产力,创造了巨大的经济效益和社会效益。由此可见,《专利法》的颁布、实施,为保护知识产权和科学技术走向市场、走向产业化开辟了广阔的前景。随着新一代微型计算机硬件(大内存、外存,高速度)和软件(操作系统等)日新月异的技术进步,为个人台式PC机(或网络终端的其它笔记本、掌上电脑)的中文手写和语音识别输入技术的开发应用,提供了足够的时空条件。计算机的汉字输入有键盘输入、手写字形识别输入和语音识别输入等多种方式。汉字键盘输入技术已走向成熟;手写字形识别输入技术,因受汉字字数多,字体种类差异,书写大小不均、个人笔迹不同…等等错综复杂的条件限制,使其识别速度比较慢,正确识别率不够理想,从而影响了它的实用价值;汉语语音识别输入技术,因受语音性质、语音类型、方言差异等等多方面因素的限制。例如,就语音性质而言,汉语只有410多个音节,带声调才有1200多个音节,汉字有6万多个,词汇量则数以百万计,同音字词太多。造成语音识别的障碍重重…,不易处理《周易》说“《易》穷则变,变则通。”“化而裁之谓之变,推而行之谓之通。”列宁说“要真正地认识事物,就必须把握、研究它的一切方面,一切联系和‘中介’。”我们从中受到“启示”,获得“灵感”;五年多来,锲而不舍地寻求汉字键盘输入、手写字形识别输入和语音识别输入等不同输入方式的联系和“中介”。在这里,我们提供的“中文手写数码、语音数码识别输入方法”便是源于上述哲学思想的中文信息处理科研成果之一。本专利技术是采用“札”字五笔画,以及26个英文小写字母作为中文“手写数码”的图形元件;或以“语音数码”,“模糊语音数码”作为汉字的识别信息;通过计算机对上述笔画和字母的字符图形进行联机书写识别,或对汉字的语音及识别数码的(Chinese speech recognition)之简单识别,按规则一转换生成-调用对应的汉字内部码(Chinese character internal code),从而实现中文“海量词语”准确、高效地输入计算机的方法。在现有专利技术智能五笔双拼码(ZL 92106366.0)的基础上,我们将汉字键盘输入、手写输入、语音输入,三者和谐地统一起来,并有效地简化了中文手写识别的繁难,避免了传统语音识别模式的诸多局限;大大地提高了中文手写输入、语音输入的正确识别率和识别速度;为计算机的中文手写输入、语音输入和中文信息检索提供了新思想、新途径。现将“中文手写数码、语音数码识别输入”的原理分述如下一、中文手写数码、语音数码识别所用的系统元件1.汉字的五个基本笔划(全角字符图形和语音)一丨丿丶(\) 乙heng shu pie dian(na)zhe2.八个亚拉伯数字(半角数字和语音)12 34 5 670yi ersansiwuliuqi Ling3.二十六个英文字母(全角小写英文字符图形)a b c d e f g h i j k l m n o p qr s t u v w x y z二、手写数码、语音数码识别的系统元件“全角小写英文字符图形、汉字笔画全角字符图形,半角数码、半角大写英文字符”的对应(转换)关系1.全角笔画(转换)=半角数字一=1丨=2丿=3丶(\)=4乙=52.全角小写英文字符图形和汉字笔画全角字符图形(转换)=半角区位数码a=一乙=15 b=乙丨=52 c=乙丶=54 d=一丿=13 e=丿丿=33f=一丨=12 g=一一=11 h=丨一=21 i=丶丿=43 j=丨丨=22k=丨丿=23 1=丨丶=24 m=丨乙=25 n=乙一=51 o=丶丶=44p=丶乙=45 q=丿乙=35 r=丿丨=32 s=一丶=14 t=丿一=31u=丶丨=42 v=乙丿=53 w=丿丶=34 x=乙乙=55 y=丶一=41z=6677=OO=OK=空格=结束图形书写信息←-=取消误写的图形信息3、半角区位数码(转换)=半角大写英文字符编码15=A52=B54=C13=D33=E12=F11=G21=H43=I22=J23=K24=L25=M51=N44=O45=P35=Q32=R14=S31=T42=U53=V34=W55=X41=Yz=66三、汉字声母的编码汉字的23个声母与半角大写英字母一一对应,韵母独立为音节时以其韵母的头字母约定为“零声母”的代码。例如,a、ao、ai、an、ang等的“零声母”为“A”,er、eng的“零声母”为“E”,ou的“零声母”为“O”等。四、汉语拼音的韵母与半角大写英文字母的对应(转换)关系A=aB=ia=uaC=uan D=aoE=eF=an G=ang H=uang=iangI=i J=ianK=iao L=in=ing M=ie N=iuO=o=uoP=ou Q=er R=en S=aiT=engU=u=ü V=ui=ueW=ei X=uai Y=ong=iongZ=un五、汉字声调的代码阴平=11=G阳平=22=J上声=33=E去声=44=O六、中文手写数码、语音数码的编码方法1.中文手写数码、语音数码的“系统元件”与键位对应关系表(反应式键盘(Reactive keyboaed)的方位坐标图) 七、中文手写数码输入的原理(附图解释一)中文手写数码输入①特定手写图形(笔画和小写英文字母)的字符写入-→②计算机对全角图形的对比分析-→转换-→③半角数字编码(手写数码)-→转换生成-→④对应(大写半角英文)字母编码-→⑤检索手写数码的编码字、词典-→⑥对应查算出汉字内码或内码串-→⑦字形地址码或地址码串→⑧字形点阵码或点阵码串-→⑨显示输出。八、中文语音数码输入的原理(附图解释二)中文语音数码输入①读入汉语词汇语音和识别数码-→②计算机对音频信息,进行频谱分析-→转换成数字编码(语音数码)本文档来自技高网...

【技术保护点】
本专利技术是采用“札”字五笔画,以及26个英文小写字母作为中文“手写数码”的图形元件;或以“语音数码”,“模糊语音数码”作为汉字的识别信息;通过计算机对上述笔画和字母的字符图形进行联机手写识别,或对汉字的语音及识别数码的(Chinese speech recognition)之简单识别,按规则-转换生成-调用对应的汉字内部码(Chinese character internal code),从而实现中文输入计算机的系统方法。其技术特征是:手写数码、语音数码识别的系统元件:“全 角小写英文字符图形、汉字笔画全角字符图形,半角数码、半角大写英文字符”的对应(转换)关系半角大写 汉字声母 汉字韵母 笔画数码 汉字声调A =a =a =一乙=15B =b =ia=ua =乙丨=52C =c =uan =乙 丶=54D =d =ao =一丿=13E =e =e =丿丿=33 上声=33=EF =f =an =一丨=12G =g =ang =一一=11 阴平=11=GH =h =uang=iang =丨一=21I =i = 丶丿=43J =j =ian =丨丨=22 阳平=22=JK =K =iao =丨丿=23L =l =in=ing =丨丶=24M =m =ie =丨乙=25N =n =iu =乙一=51O =o =o=uo =丶丶 =44 去声=44=OP =p =ou =丶乙=45Q =q =er =丿乙=35R =r =en =丿丨=32S =s =ai =一丶=14T =t =eng =丿一=31U =u=ü =丶丨=42V =ui= ue =乙丿=53W =w =ei =丿丶=34X =x =uai =乙乙=55Y =y =ong=iong =丶一=41Z =z =un =6677=00=OK=空格=结束图形书写信息 ←-=取消误写的图形信息。...

【技术特征摘要】

【专利技术属性】
技术研发人员:汤建民
申请(专利权)人:汤建民
类型:发明
国别省市:81[中国|广州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1