当前位置: 首页 > 专利查询>师忠孝专利>正文

满、锡、蒙、托文智能化语词处理系统技术方案

技术编号:2893069 阅读:217 留言:0更新日期:2012-04-11 18:40
一种适用于以回纥字母为基础的满、锡伯、蒙古、托忒4种文字的计算机语词处理系统。其特征为,每个字母只占一个键位,其变体由计算机根据该字母所处位置自动选用,从而简化了操作,节省了键位。节省下来的键位用来安排高频词、词缀、词尾以及用户自定义词组的整体输入,又进一步简化了操作,提高了速度。(*该技术在2009年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术是一种适用于以回纥字母为基础的满、锡伯、蒙古、托忒4种文字的计算机语词处理系统。回纥字母的特点是从上到下连写,字母少,符形多。以蒙文为例,蒙文虽只有31个字母,但每个字母不但因所处位置不同(单写、词首、词中、词末,词中音节首、音节末,第一音节、后续音节)而有不同的写法,在同一位置上还因所在音节是阳性、阴性还是中性而写法各异。有的字母,单个变体即多达8种。此外还有代表两个音素的合体字母50多个,合体字母也有上述变体。符形总数超过二百。(满文和锡文还有因t、d同形而引起的复杂变化)已知的解决办法是把这些符形归并为82个(蒙文),安排到计算机键盘的上、下两档,键入时所有变体均由人工选用。(见内蒙古自治区电子计算中心1986年7月报审的《蒙古文信息处理三项国家标准研制报告》和国家标准局同年发布实施的中华人民共和国标准《信息处理交换用蒙文字符集、键盘的字母数字区布局》)这个办法脱胎于蒙文机械打字机,其主要缺点是(1)键入时不得不频繁换档,极为不便;(2)不同字母的同形变体全被归并为一个,无法排序。本专利技术的任务是克服上述缺点,简化操作,提高速度,同时为机器排序、检索创造条件。本专利技术的任务是这样完成的,利用本专利技术“自动选形”这个特征,使每个字母,不管有多少变体,都只占一个键位,其变体由计算机根据该字母被键击时所处环境自动选用,或在自动选用之后再由其后字符键自动调整;合体字母由计算机自动合成,不占键位,其变体也由计算机自动选用和调整;托忒文中表示其前元音为长元音的“ ”,通过再击其前元音字母键取得,不占键位。本专利技术包括键盘和程序两部分,在计算机上实施。各文种的键盘上各有一个文种键(视具体文种分别标为“满/锡”或“蒙/托”)、一个“菜单选形键” 和一个由普通字符键定义的“特设键” (托忒文无 )。满文和锡文共用一个键盘,但文种键分立(同键切换)。满-锡、蒙、托忒文的键盘分别包括30、31、31个字母键位。键盘字符区的布局特点是全部字母及12个频度最高的高频词集中于同一档-基档。上档的数字排安排数码,上、中、下三排除安排基档没安排下的标点符号外,其余键位留给了待扩充的高频词及用户自定义词组(附图说明图1、2、3)。本专利技术的根本特征是“自动选形”,即每个字母,不管有多少变体,都只占一个键位,其变体由计算机根据该字母被键击时所处环境自动选用,或在自动选用之后再由其后字符键自动调整;合体字母由计算机自动合成,不占键位,其变位也由计算机自动选用和调整;托忒文中表示其前元音为长元音的“ ”通过再击其前元音字母键取得,不占键位。只用于借词的若干个罕用字母(满文和锡文中的 和蒙文中的 )由与之相近的其它字母( )加上一个由普通字符键定义的特设键,双击取得。在键盘中有一“菜单选形键” ,按下此键后,则在键入过程中,在屏心显示“自动选形”的结果,同时,屏底自动列出屏心被选符形所属字母(包括合体字母)的冠以序号的全部变体;此时若击数码键选择,则被选变体即取代屏心的变体,其余变体隐去;若不击数码键而继续键入字母,则屏底符形随之更新。满文和锡文共用一套程序,相异之处由计算机自动查访文种状态作出适当处理。蒙文和托忒文各有一套程序。编程步骤是(1)根据通用字母顺序编制包括所有变体的字母符形代码表(表1、2、3);(2)根据拼写特点对字母进行归类;(3)按类编程。程序的基本思路是通过“回扫”取得依据,据此选用变体。单个字母的基本程序是若前一符不是本文种字母,则出本键字母的词首形式,否则出词中形式。合体字母由代表其第二个音素的那一个字母所在的键位负责回扫前一符,并视需要把前一符加以改变而取得。变体分阴阳的字母,根据回扫结果决定自己的阴阳,发现阳性字母则出阳性变体,否则出阴性变体。一些只用于借词的罕用字母借助 输入,如在满文-锡文中,击 之后再击 ,则分别得到 。本系统另设一“菜单选形键” 。按下此键后,系统即在自动选形的同时,把屏心被选符形所属字母(包括合体字母)的所有符形冠以序号列于屏底。此时若击数码键,则被选变体移于屏心,取代被“自动”选入的符形;若不击数码键而是继续输入,则屏底所列符形自动随之不断更新。由于本专利技术的特征是“自动选形”,这个特征带来了以下好处1.全部字母安排在一个档上,完全免去了换档之烦,大大提高了速度,且好学易记。2.节省下来的大量键位(蒙文比现有技术节省了50个键位),一部分用来安排了高频词、词缀和词尾(为行文方便,以下总称“高频词”)的整体输入(其不同变体也由计算机自动选用),一部分留给用户安排自定义词组。这样,击一键即可输入一串字符,从而进一步简化了操作。3.键盘得以合理布局。4.便于排序、检索。下面通过三个实施例对本专利技术详加说明。说明中除 、 外,还使用以下略符K 键击字符的第一个代码Q 前一字符QQ 前一字符的前一字符G 光标所在字符Y 变量,扫描中一发现阳性字母,则Y=2,否则Y=1C 变量,按下 后C=1X 变量,机器处于锡文状态时X=1满文-锡文实施例一、键盘图(图1)注(1) -领属-工具格,含 (2) -位-向格(3) -宾-经格(4) -从-经格(分写),条件副动词(连写)(5) -从格(6) -“我”、“有”、现在进行时词尾(7) -动词原形及现在时词尾(8) -现在时词尾(9) -并列副动词词尾(10) -顺序副动词词尾(11) -现在将来时词尾,含 (12) -“不”、“没有”、“未”二、编程用字母符形代码表(表1)三、分组程序第1组 1 若Q>156,则出K,结束2 若Q=46,48,90,92,94,则把Q分别改为110,112,114,116,118,结束3 出K+1,结束第二组 1 若Q>156,则出K,结束2 若Q=32、33、37,40、41、42,43、44、45,46,48,则把Q分别改为120,122,124,126,128,结束3 若Q=56,57,62,63,则把Q分别改为60,61,64,65,出K+1,结束4 出K+1,结束第3组 1 若Q>156,则出K,结束2 若Q=32、33、37,40、41、42,43、44、45,46,48,则把Q分别改为130,132,134,136,138,结束3 若Q=11~15,132~139,则出K+4,结束4 若Q=1~26,110~155,若X=1,则出K+4,结束否则出K+3,结束5 若Q=96 or 97,则出K+5,结束6 若Q=99 or 100,则把Q改为Q+41,结束7 出K+1,结束第4组 1 若Q>156,则出K,结束2 若Q=46,48,90,92,94,则把Q分别改为143,144,145,146,147,结束3 若Q=37,42,45,则把Q分别改为33,41,44,出K+1,结束4 若X=1,则转入65 若Q=81 or 82,则把Q改为84,出K+1,结束6 出K+1,结束第5组 1 若Q>156,则出K,结束2 若Q=32、33、37,40、41、42,43、44、45,46,48,则把Q分别改为148,149,150,151,152,结束3 若Q=56,57,62,63,则把Q分别改为60,61,64,65本文档来自技高网...

【技术保护点】
一种适用于以回纥字母为基础的满、锡伯、蒙古、托忒4种文字的计算机语词处理系统,本系统的特征在于,一个字母只占一个键位,其变体由计算机根据该字母被键击时所处位置自动选用,或在自动选用之后再由其后字符键自动调整;合体字母(即代表两个音素但在形体上不可再分的字母)由计算机自动合成,不另占键位,它们的变体由计算机自动选用和调整;高频词、词缀及词尾作为字符串单键整体输入,其语法变体由计算机自动选用。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:师忠孝
申请(专利权)人:师忠孝
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1