当前位置: 首页 > 专利查询>暨南大学专利>正文

一种基于简拼的藏文词组输入法制造技术

技术编号:3920950 阅读:426 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种藏文词组输入法。这种方法主要利用藏文字根及元音字符的有效组合形成编码,适用于当前流行的多种藏文输入编码或键盘布局,具有重码低,易于实现,易于建立和扩充词库等特点,且符合藏文书写的自然思维方式,容易理解,且容易使用。

【技术实现步骤摘要】

本专利技术涉及藏文信息输入技术,特别涉及一种基于简拼的藏文词组输入法
技术介绍
藏文是中华民族文化宝库中的一颗明珠,它是依据印度梵文创立的拼音文字,留 传至今已有一千三百多年的悠久历史,是当今世界风采依旧的古老文字之一。藏文具有与 汉文媲美的浩瀚文献,而且还有大量金铭石刻、木简木牍和文书经巻等,为藏民族文化的传 承和发展发挥着重要作用。 藏文是拼音文字,它的词组或句子是由一个个音节(或称为字)组成的,一个音节 对应一个音, 一个音节又由若干藏文字母组成,粗看起来它和英文很相似,具有从左向右横向书写的线性结构,如^fir^^'q^^^f5 ("扎西德勒",意为"吉祥如意");但是对于一个藏文音节来说,它又要从一个基字开始,由上加字、下加字、前加字、后加字迭加组合而成, 因而又具有了平面字的特点。藏文音节的结构是以一个字母为核心,核心字母叫"基字",其 余字母在此基础上前后附加和上下叠写,组合成一个完整的字表结构,如图1所示。 通常藏文字形结构最少为一个辅音字母,即单独由一个基字构成,如^'最多由6个辅音字母构成,如^|^]^,元音符号则加在辅音结构的上、下、正中,元音不能单独使用,其余辅音字母的称谓都根据加在基字的部位而得名。加在基字前的字母叫"前加字",加在 基字上的字母叫"上加字",加在基字下面的字母叫"下加字",加在基字后面的字母叫"后加 字",而后加字之后再加字母叫"再后加字"或"重后加字"。藏文30个辅音字母均可作基字, 但是,可作前加字、后加字、上加字、下加字的字母在文法中都是有规定的,而且数量有限。 再后加字,在文字厘定中已经取消,只出现于文献中。 藏文的读音也是以基字辅音为中心的,一个音节只有一个元音(元音a可省略), 因此一个音节对应一个音,在拉萨语中前加字和上加字辅音都已不发音,在安多语中也有 一部分不发音。 藏文的书写是以音节为单位,从左到右横写,音节之间用小点隔开,如 qg,^'q^^hj^,而字节的书写顺序基本是D前加字,2)上加字,3)基字,4)下加字,5)元音,6)后加字,7)再后加字。大部分的输入法也是按此顺序来输入藏文编码的。 从藏文字的结构、发音及拼写方法来看,有两个部件是不可缺少的,那就是基字和元音,因此,本专利技术提出的词组输入编码方案就是以它们为基础的。 随着信息技术的飞速发展与广泛应用,藏文信息处理技术及应用也得到了重视, 近年来,在藏文操作系统、藏文信息技术标准、藏语音信息处理和综合应用等领域取得了较 大进展,但由于受到用户数量、市场规模及技术力量等因素的制约,与汉字信息处理技术相 比,藏文信息处理技术的成果还有一定的差距。藏文输入技术是藏文信息处理中的一个不 可缺少关键技术,目前,Windows Vista系统已经支持了藏文,其中配备了自带的Unicode字体的Himalaya藏文输入法,其他广泛使用的藏文输入法主要有国内的同元藏文输入法、央金藏文输入法、班智达藏文输入法、琼迈藏文输入法、宗喀藏文输入法等,以及国外的桑布扎(Sambhota)藏文输入法、Tise藏文输入法和keyman藏文输入法等。 目前,藏文的录入速度与汉文录入技术相比仍具有明显差距,主要原因是缺乏高效的词组输入法。在现有输入法当中,仅有少数具有词组输入功能,微软的Himalaya输入法等国外的藏文输入法都不支持词组输入法,而国内的具有词组输入的班智达输入法采用了基字加后加字的词组编码方案,但具有不自然、难记难用且重码多等缺点。因此急需开发一种易用、自然、通用性强且重码低的词组输入方案,以提高藏文的录入速度。
技术实现思路
本专利技术的目的在于针对现有技术的不足,克服目前藏文输入法缺乏词组输入或者词组输入编码难学难用等缺点,提供一种基于简拼的藏文词组输入法,具体为,利用藏文字根及元音字符的有效组合形成编码,适用于当前流行的多种藏文输入编码或键盘布局,通用性强,具有重码低,易于实现,易于建立和扩充词库等特点,且符合藏文书写的自然思维方式,容易理解及使用。 本专利技术的目的通过以下技术方案得以实现一种基于简拼的藏文词组输入法,具体如下 以构成词组的各音节的字根辅音字母及其元音字母的组合作为该词组的输入编码,输入时,其中字根辅音字母是必需的,而元音字母视情况可选;当某字根的输入编码由多个键盘字符组成时,则仅用该字根得首字符;当词组音节数较长时,可用*号作为通配符,不必输入剩余字节的编码字符;在整个词组的编码字符串中,音节间不加空格。 以Wylie拉丁转写输入法编码为例,藏文的30个辅音字母及4个元音字母的编码如下<formula>formula see original document page 4</formula>其中有的藏文字母对应多个键盘字符,例如R对应ng, S^对应tsh。词组.q^]'^N'q,^I^的Wylie输入法的编码串为"bkra shis bde legs",按本专利技术的词组输入方案,该词组有以下几种输入方式 1)完整的词组输入编码,即包括所有音节的字根辅音字符及其元音字符,,kasidele,,; 2)省去所有元音字符,仅以构成词组的各音节的字根字符作为输入编码"ksdl"; 3)省去某些字节的元音字符,因此有多种组合,如"kasdl"或"kasidl"或,,ksdele,,或,,kasidle,,等; 4)用*号作为通配符,不必输入剩余字节,例如"kasi*"或"ksc^"或"ksi承"等,当词组音节数较长时这种方法很有效。 相比于现有技术,本专利技术具有以下突出的优点和有益效果 1)通用性强 本专利技术的词组编码方案可应用于现存的大多数输入法,使得那些还未具有词组输入的藏文输入法很容易得以功能扩展,例如词组q23,Wq^'^^l^,对于桑布扎(Sambhota)藏文输入法的keym即l,按本专利技术,其词组输入编码串为"kaSidele"或"kSdl"等. 2)词组输入快速高效、重码少 词组门!!],^"^'》^的Wylie输入法的编码串为"bkra shis bde legs" —共18键,而按本输入法,"ksdl"加上一个空格键一共仅需5键,对于音节较短的词组,可添加某音节的元音字母便可降低重码率,以减少翻页键;对于较长的词组,如^^奇^^'瑜'513^^^':^'各'£1|,^ Wylie输入编码一共42键,而利用本编码的通配符气输入编码为"kbocp圹,,加上一个空格键一共仅需7键,无需翻页即可查到。可见,使用本专利技术后,藏文词组的输入效率可成倍提高; 3)符合藏文书写的思维习惯,好学易记 本专利技术的词组输入编码是基于藏文的基字和元音这两个基本元素的有效组合,符合藏文书写的思维习惯,好学易记,而不像部分输入法采用了难以记忆的后加字的参与,这是一种不自然的编码,难记而不实用; 4)易于利用现有资源,建立和扩充词库 采用本专利技术提出的编码方案,可以方便地利用网络等现有资源,将网络中的各类电子藏文词条、词汇转换并添入输入法的词库,使得词库可随时扩充,与时倶进; 5)实现词频动态更新,用户词组记忆 本专利技术的词组输入法可实现词组高频先见,并采用将静态统计与动态调整相结合的词频动态更新,以实现适应用户特点的个性化输入模式;另外,本方案还可方便地实现用户词组的记本文档来自技高网
...

【技术保护点】
一种基于简拼的藏文词组输入法,其特征在于,以藏文字根及元音的有效组合形成词组编码,适用于当前藏文输入编码和键盘布局,进一步,词组输入方案具体为:以构成词组的各音节的字根辅音字母以及元音字母的组合作为该词组的输入编码,输入时,其中字根辅音字母是必需的;同时,当某字根的输入编码由多个键盘字符组成时,则仅用该字根的首字符,当词组音节数较长时,可用*号作为通配符,不必输入剩余字节的编码字符;在整个词组的编码字符串中,音节间不加空格。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄战
申请(专利权)人:暨南大学
类型:发明
国别省市:81[中国|广州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1