汉语拼音输入系统及其方法技术方案

技术编号:7363543 阅读:313 留言:0更新日期:2012-05-26 21:57
本发明专利技术公开了一种汉语拼音输入系统及其方法,其通过预先建立韵母转换表,并于接收输入拼音时根据韵母转换表将输入拼音中的声调韵母字串转换为韵母编码,并根据输入拼音中的声母字串及韵母编码产生拼音编码再撷取对应拼音编码的汉语字元供使用者选取作为输入字元的技术手段,借此可以达成提高拼音输入时汉语字元撷取的精确性的技术功效。

【技术实现步骤摘要】

本专利技术涉及一种,特别是指一种供使用者于进行拼音输入时输入声调,并根据使用者输入的声母、韵母及声调撷取汉语字元供使用者选取作为输入字元的。
技术介绍
拼音输入法是一种利用罗马拼音来输入汉语字元的输入法,与注音输入法、仓颉输入法等需学习特定字元拼写的输入法不同的是,拼音输入法可以直接以英文字元的输入组合产生候选的汉语字元,因此除了汉语母语的使用者使用方便外,非汉语母语的使用者也可以在不需更换键盘装置的情况下轻松地进行汉语字元的输入。拼音输入法与注音输入法相似的部分是拼音主要是由声母和韵母两个部分构成。 声母包含:b(々)、p(^)、m(n)、f(C)、d(^)、t(ir)、n(10、l(S)、g(〈〈)、k(^)、 h(厂)、j( M)、q( < )、x(T)、zh(虫)、ch(才)、sh(尸)、r( Θ )、z(卩)、c(亏)及 s(厶)等21个声母。韵母与注音输入法类似,包含a(丫)、o(f )、e(亡)、i (一)...等共37个韵母。然而,汉语字元实际上除了声母和韵母外,声调更分为一声、二声、三声、四声及轻声,但由于拼音输入法当中一般无法结合声调进行输入,使得使用者在进行汉语输入时经常需要花费额外的时间自行判别拼音输入法撷取出来的汉语字元的声调才能够进行汉语输入,而系统所撷取的汉语字元也由于混合着各种声调,无法撷取出精确的汉语字元供使用者选取输入,因此有必要提出改进的技术手段,来解决此一问题。
技术实现思路
有鉴于现有技术存在的问题,本专利技术于是公开一种, 其中本专利技术所公开的汉语拼音输入系统,其包含汉语字库,预先储存有至少一汉语字元,其中各该汉语字元对应至少一拼音编码;解析模块,用以接收输入拼音,并自输入拼音中拆解出声母字串及声调韵母字串;编码转换模块,预先建立有韵母转换表,韵母转换表包含至少一声调韵母字串及与各声调韵母字串对应的韵母编码,编码转换模块用以根据韵母转换表将声调韵母字串转换为对应的韵母编码,并根据声母字串及韵母编码产生对应的拼音编码;撷取模块,用以至汉语字库中撷取对应拼音编码的至少一汉语字元;及显示模块, 用以显示撷取出的至少一汉语字元供使用者选择其中之一作为输入字元。本专利技术所公开的汉语拼音输入方法,其包含步骤预先于汉语字库储存至少一汉语字元,其中各汉语字元对应至少一拼音编码;预先建立韵母转换表,韵母转换表包含至少一声调韵母字串及与各声调韵母字串对应的韵母编码;接收输入拼音,并自输入拼音中拆解出声母字串及声调韵母字串;根据韵母转换表将声调韵母字串转换为对应的韵母编码, 并根据声母字串及韵母编码产生对应的拼音编码;根据拼音编码撷取对应的至少一汉语字元;及显示撷取的至少一汉语字元供使用者选择其中之一作为输入字元。3本专利技术所公开的系统与方法如上,与现有技术之间的差异在于本专利技术通过预先建立韵母转换表,并于接收输入拼音时根据韵母转换表将输入拼音中的声调韵母字串转换为韵母编码,并根据输入拼音中的声母字串及韵母编码产生拼音编码再撷取对应拼音编码的汉语字元供使用者选取作为输入字元。通过上述的技术手段,本专利技术可以达成提高拼音输入时汉语字元撷取的精确性的技术功效。附图说明图1为本专利技术汉语拼音输入系统的方块图。图2为本专利技术汉语拼音输入方法的流程图。图3为本实施例韵母转换表的示意图。主要元件符号说明101汉语字库102解析模块103编码转换模块104撷取模块105显示模块106排序模块301韵母转换表具体实施例方式在说明本专利技术之前,先对本专利技术的内容进行介绍以汉语字元“甲”为例,汉语字元 “甲”读做“M丨丫 ν ”,在以往的拼音输入法中,输入方式仅输入“jia”,因此最后撷取出的候选字元可能混合着各种不同声调(一声、二声、三声、四声或轻声)但声母韵母与“甲”相同的汉语字元,如“家”、“夹”、“架”...等,除了输入方式不够精确外,系统也不支援输入声调的判别,因此使用者往往需要自行花费额外的时间判别候选字元的声调。而本专利技术的汉语拼音输入系统中每一个汉语字元都会对应至少一拼音编码,每一个拼音编码都会对应一种读音,由于汉语字元有时会有多种不同读音,因此本专利技术可以借由比对拼音编码,撷取出对应的汉语字元。以下将配合图式及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。首先,请先参考图1,为本专利技术汉语拼音输入系统的方块图,其包含汉语字库 101、解析模块102、编码转换模块103、撷取模块104及显示模块105。汉语字库101,预先储存有至少一汉语字元,其中每一汉语字元对应至少一拼音编码,且每一个拼音编码都会对应一种读音。举例来说,汉语字元“假”由于读音可读做“ MI 丫 ι及“M I Y γ”,因此“假”对应的拼音编码可以利用utf-8的字码“jid>”及“jia” 作为拼音编码。需要特别说明的是,拼音编码可以借由UTF-8中字元的特殊形式来表示不同的声调,例如拼音韵母“e”的一声、二声、三声、四声及轻声可以利用UTF-8字元的“ ”、 “ ”、“ ”、“ ”及“e”个别表示。因此,以汉字字元“舍”为例,其拼音编码可以利用UTF-8的拼音编码“sM”表示。由于汉语字元有时会有多种不同读音,因此系统借由比对拼音编码, 可以撷取出对应的汉语字元。解析模块102,用以接收使用者所输入的输入拼音,并自输入拼音中拆解出声母字串及声调韵母字串。举例来说,假设系统支援的声调韵母字串的形式为拼音加上1 4中的其中一个数字,其中1 4的数字用来表示声调,1表一声,2表二声,以此类推,轻声则不加任何数字,则当输入拼音为“she3”时,解析模块102将会将输入拼音拆解为声母字串“sh” 及声调韵母字串“e3”。编码转换模块103,预先建立有韵母转换表,韵母转换表包含至少一声调韵母字串及与各声调韵母字串对应的韵母编码。由于对于使用者来说输入UTF-8格式的字元较为不便,因此可以预先在编码转换模块103当中预先建立一个韵母转换表,使用者只要输入系统支援的声调韵母字串形式的输入拼音,例如一般字元及数字,此时编码转换模块103便可以自动产生对应输入拼音的拼音编码。由于韵母转换表中预先建立有系统可辨识转换的声调韵母字串及韵母编码的对应关系,因此承前面输入拼音为“she3”的例子,声调韵母字串“e3”将会被编码转换模块103转换为韵母编码,假设韵母转换表中“e3”韵母编码形式是以UTF-8字元的“ ”表示,则编码转换模块103将声调韵母字串“e3”转为韵母编码后, 将会根据声母字串“sh”及韵母编码“ ”产生拼音编码“吐§”。撷取模块104,负责至汉语字库101当中撷取对应拼音编码的至少一汉语字元。举例来说,假设拼音编码为“d0ng”,则撷取模块104将会撷取出“动”、“洞”、“栋”...等汉语字元,而撷取模块104撷取出的汉语字元,将会再通过显示模块105显示出来供使用者选择其中之一作为输入字元。此外,显示模块105显示撷取出的至少一汉语字元时,也可以同时显示拼音编码“ dong”,借此来提示使用者对应“ dong4,,的拼音编码。本专利技术的汉语拼音输入系统除了上述的模块之外,更可以包含一个排序模块106, 用以根据字元属性排列撷取模块104撷取的至少一汉语本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:邱全成王辉
申请(专利权)人:英业达股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术