一种基于拼音的藏文智能输入法制造技术

技术编号:10313807 阅读:286 留言:1更新日期:2014-08-13 16:07
本发明专利技术公开了一种基于拼音的藏文智能输入法。本方法为:1)将每一藏文辅音字母和每一藏文元音字母分别设置一键位码;2)根据藏文音节的拼写顺序对每一音节设置一对应的拼音编码,并将其保存到一输入法字库中;3)建立一拼音编码与键位码的关系树;4)基于所述输入法字库建立一输入法引擎,所述输入法引擎根据输入的键位码遍历所述关系树,得到对应的拼音编码;然后根据该拼音编码查询所述输入法字库,返回对应的藏文。与现有技术相比,本发明专利技术具有重码低,易于实现,易于建立和扩充词库等特点,且符合藏文书写的自然思维方式,让藏文的输入更方便、快捷、灵活。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了。本方法为:1)将每一藏文辅音字母和每一藏文元音字母分别设置一键位码;2)根据藏文音节的拼写顺序对每一音节设置一对应的拼音编码,并将其保存到一输入法字库中;3)建立一拼音编码与键位码的关系树;4)基于所述输入法字库建立一输入法引擎,所述输入法引擎根据输入的键位码遍历所述关系树,得到对应的拼音编码;然后根据该拼音编码查询所述输入法字库,返回对应的藏文。与现有技术相比,本专利技术具有重码低,易于实现,易于建立和扩充词库等特点,且符合藏文书写的自然思维方式,让藏文的输入更方便、快捷、灵活。【专利说明】
本专利技术涉及一种输入法,尤其涉及。
技术介绍
藏文自创制以来,无论作为民族文化传承的主要载体,还是现在作为藏区传播科技知识的主要工具,甚至作为信息化社会中一个民族的主要标示符,其独特的人类文化价值和在广大藏区发挥的巨大作用是不可估量的。藏文跨入信息时代数十年来,在计算机藏文信息处理的各方面得到了长足的发展,也取得了不少的成绩,从藏文的打字录入到藏文排版处理、藏文电子邮件的收发、藏文网站建设、藏文应用软件的开发、藏文课件的制作等等。藏文是拼音文字,具有横向书写性结构同时还具有纵向书写性结构,它的词组或句子是由一个个音节(或称为字)组成的,一个音节对应一个音,一个音节又有若干个藏文字母组成,粗看起来它和英文很相似,如但是对于一个藏文音节来说,它又要从一个基字开始,由上加字、下加字、前加字、后加字叠加组合而成,因而又有了平面字的特点。藏文的音节的结构是以一个字母为核心,核心的字母叫“基字”,其余的字母在此基础上前后附加和上下叠写,组合成一个完整的字表结构,且每个字母的称谓都根据加在基字的部位而得名。如图1所示。藏文30个辅 音字母均可作基字,但是,可做前、后、上、下加字的字母在文法中都是有规定的,而且数量有限。藏文读音也是基字辅音为中心的,一个音节只有一个元音(元音a可省略),因此一个音节对应一个音,在藏文拼读时,从最左边的辅音字母开始,其顺序是I)前加字,2)上加子,3)基子,4)下加子,5)兀首,6)后加子,7)再后加子。藏文的书写是以音节为单位,从左到右横写,音节之间用小点隔开,如,音节的书写顺序与拼读的顺序一致,大部分输入法也是按照此顺序来输入藏文编码的,但是具体输入理论较为复杂,而且有很大的弊端,因为当书写上加字或下加字时某些特殊的字母需变形,所以藏文在国际编码Unicode中一共定义了 211个字符,其中包含普通字符、叠加字符、数字符号、天文历算符号等。再利用Opentype字库标记特征,将这些普通字符与叠加字符组合而成,此功能是字体库本身具备的而非输入法,输入法将根据用户的输入形成字符编码,字体库根据此编码通过字库标记特征从而显示藏文音节。目前,藏文的录入速度与汉文等其它部分语言的录入速度相比仍具有明显差距,尤其在移动终端上,主要原因缺乏高效的、智能的输入法。在现有输入法当中,仅有少数具有词组输入功能,微软Himalaya输入法等国外藏文输入法都不支持词组或智能输入法,而国内的具有词组输入的班智达输入法采用了基字加后加字的词组编码方案,但具有不自然,难记难用且重码多,用户可随意输入字符任意组合,违反藏文的文法等缺点。因此急需开发一种易用、自然、通用性强且重码低的智能输入方案,以提高藏文的录入速度。
技术实现思路
为了克服现有技术中存在的技术问题,本专利技术的目的在于提供一种基于拼音搜索的藏文输入法,根据藏文的文字结构、发音特征及拼写方法,本专利技术将一些字母作为拼音字符来标识特定音节,不考虑音节的叠加过程表示,实现拼音输入,因此本专利技术提出的拼音输入法就是以它为基础的。具体为利用好藏文的拼读规则,将藏文音节与对应关系的拼音存放到字库中,通过输入法形成拼音编码,再根据输入法引擎返回目标字集。因此本专利技术具有重码低,易于实现,易于建立和扩充词库等特点,且符合藏文书写的自然思维方式,容易理解及使用。本专利技术目的通过以下技术方案得以实现:,其步骤为:I)将每一藏文辅音字母和每一藏文兀音字母分别设置一键位码;2)根据藏文音节的拼写顺序对每一音节设置一对应的拼音编码,并将其保存到一输入法字库中;3)建立一拼音编码与键位码的关系树;4)基于所述输入法字库建立一输入法引擎,所述输入法引擎根据输入的键位码遍历所述关系树,得到对应的拼音编码;然后根据该拼音编码查询所述输入法字库,返回对应的藏文。进一步的,所述对每一音节设置一对应的拼音的方法为:对于单字符藏文音节,设置其拼音为单字符藏文音节本身;对于无上下叠加的多字符藏文音节,设置其拼音为多字符藏文音节本身;对于有上下叠加的多字符藏文音节,设置其拼音为单字符藏文音节本身。进一步的,同一拼音编码对应一个或多个音节。进一步的,所述输入法引擎根据拼音编码查找匹配的拼音,将所有与这个拼音匹配或以这个拼音为开头的藏文显示到输入法的候选字区域中,并按词频顺序排序。进一步的,在移动设备上采用全键盘模式或者九宫格模式作为藏文辅音字母和元音字母的输入界面。进一步的,在PC上采用喜马拉雅输入法的键位方式作为藏文辅音字母和元音字母的输入界面。本专利技术的流程图如图2所示,其具体步骤如下:一、规定30个藏文辅音字母和4个元音字母来组成拼音字符,并且根据藏文拼写顺序组合形成每音节对应的拼音。如表1为藏文的辅音字母:表1为藏文辅音字母表【权利要求】1.,其步骤为: 1)将每一藏文辅音字母和每一藏文元音字母分别设置一键位码; 2)根据藏文音节的拼写顺序对每一音节设置一对应的拼音编码,并将其保存到一输入法字库中; 3)建立一拼音编码与键位码的关系树; 4)基于所述输入法字库建立一输入法引擎,所述输入法引擎根据输入的键位码遍历所述关系树,得到对应的拼音编码;然后根据该拼音编码查询所述输入法字库,返回对应的藏文。2.如权利要求1所述的方法,其特征在于所述对每一音节设置一对应的拼音的方法为:对于单字符藏文音节,设置其拼音为单字符藏文音节本身;对于无上下叠加的多字符藏文音节,设置其拼音为多字符藏文音节本身;对于有上下叠加的多字符藏文音节,设置其拼音为单字符藏文音节本身。3.如权利要求2所述的方法,其特征在于同一拼音编码对应一个或多个音节。4.如权利要求1或2或3所述的方法,其特征在于所述输入法引擎根据拼音编码查找匹配的拼音,将所有与这个拼音匹配或以这个拼音为开头的藏文显示到输入法的候选字区域中,并按词频顺序排序。5.如权利要求1所述的方法,其特征在于在移动设备上采用全键盘模式或者九宫格模式作为藏文辅音字母和元音字母的输入界面。6.如权利要求1所述的方法,其特征在于在PC上采用喜马拉雅输入法的键位方式作为藏文辅音字母和元音字母的输入界面。【文档编号】G06F3/023GK103984420SQ201410142863【公开日】2014年8月13日 申请日期:2014年4月10日 优先权日:2014年4月10日 【专利技术者】程卫军, 洛桑旦增 申请人:中央民族大学本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/201410142863.html" title="一种基于拼音的藏文智能输入法原文来自X技术">基于拼音的藏文智能输入法</a>

【技术保护点】
一种基于拼音的藏文智能输入法,其步骤为:1)将每一藏文辅音字母和每一藏文元音字母分别设置一键位码;2)根据藏文音节的拼写顺序对每一音节设置一对应的拼音编码,并将其保存到一输入法字库中;3)建立一拼音编码与键位码的关系树;4)基于所述输入法字库建立一输入法引擎,所述输入法引擎根据输入的键位码遍历所述关系树,得到对应的拼音编码;然后根据该拼音编码查询所述输入法字库,返回对应的藏文。

【技术特征摘要】

【专利技术属性】
技术研发人员:程卫军洛桑旦增
申请(专利权)人:中央民族大学
类型:发明
国别省市:北京;11

网友询问留言 已有1条评论
  • 来自[美国加利福尼亚州圣克拉拉县山景市谷歌公司] 2014年12月25日 18:32
    藏文指藏族使用的藏语文藏语属汉藏语系藏缅语族藏语支适用地区主要有中国境内的藏族人以及尼泊尔不丹印度巴基斯坦境内的一部分人藏文属于元音附标文字[1]关于藏文的起源有两种说法佛教学者认为是吐蕃时代公元7世纪由国王松赞干布派遣藏族语言学家吞弥·桑布扎到北印度学习梵文回国后引用梵文字母创制的但雍仲本教学者则认为藏文完全是从象雄文演变而来
    0
1