可处理多音字的拼音/注音转换系统及方法技术方案

技术编号:2877495 阅读:768 留言:0更新日期:2012-04-11 18:40
一种可处理多音字的拼音/注音转换系统及方法,进行简体中文汉字拼音和繁体中文汉字注音的输入与相互转换,通过本发明专利技术所提供的“汉语拼音/注音”对应关系转换表,以语言标记的方式决定其内部对应转换数据库模式,即只需要提供一套对应的带语音标记的汉字数据库,便能够实现“汉字/汉语拼音”、“汉字/注音”以及“汉语拼音/注音”等多种转换的功能;而本发明专利技术的另一个重点在于该“汉语拼音/注音”对应关系转换表能够在拼音/注音转换过程中提供有关多音字的多种发音的处理方法。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种,特别是涉及一种应用于计算机可执行操作系统平台上,用以进行简体中文汉字、繁体中文汉字之间汉语拼音和注音拼音的输入与自动转换。然而由于现行世界各地所使用的文字语言在计算机上具有许多不同的编码方式,所以往往在信息交流的过程当中会造成交换信息的双方在内容的解读及认识上出现一定程度上的潜在的困扰,例如繁体汉字与简体汉字,就有根本上的编码方式的差别存在,也因此对于在所使用的操作系统平台上加载所谓的繁体、简体汉字互换功能的软件需求也就越来越迫切。由于繁体、简体文字所采行的拼音方式不同,具体来说就是繁体字采用「注音」的编码方式,而简体字采用「汉语拼音」编码方式的基本差异存在,因而导致在进行繁体简体汉字互换的过程中,通常必须先对原始文字的发音做必要的转换,以便获取到欲转换字词的正确发音,最后才能得到正确的繁体或简体字词。就过去公知的技术而言,几种类似的繁体简体汉字互换功能的软件在处理繁体转简体或是简体转繁体中「字转音」的部分时,几乎都是通过在操作系统内部分别建立两套储存有各自发音符号和其对应的简体字和繁体字的对应数据库,然后在处理过程中将原始文字的发音符号拿来跟对应数据库中所记载的转换发音数据逐一对比,找到需要转换的正确发音符号。这样的处理方式会有下列几个问题首先,为了提高对比结果的成功率,必须花费大量的人力以及时间去从事数据库的维护工作,造成人力、金钱、时间成本上不必要的浪费;再者,使用人力维护数据库不但容易因为人员的疏忽而造成数据库内容上产生谬误,也极难保证两者数据库内容的一致性;此外,与日俱增的庞大数据库内容的存储也将造成硬件空间上的沉重负担,尤其是当有大量文件信息需要进行识别转换时,还会造成执行效率上的不佳。而从另一项公知的技术中发现,这些具有繁体/简体汉字互换功能的软件在处理繁体/简体或是简体/繁体中「字转音」的部分时,并不能够为多音字的转换提供一种有效的解决方法,也就是在现有方法中只能依照数据库所储存的现有数据去提供有限的发音内容,但是对于多音字的某一种发音,就不能处理该多音字的其它发音,这样一来在转换过程当中可能因为数据库内容的不够完整而影响到对比的结果,进而造成对信息的解读及认识上产生语意上的错误,严重时甚至还会影响到工作进度上的问题。因此,在对繁体/简体汉字互换功能的软件需求逐渐扩增时,我们正需要一种能够同时提供简体中文汉字、繁体中文汉字的输入和自动转换并且可以提供多音字处理的系统及方法,来解决前述技术上的不足。本专利技术的上述目的是这样实现的一种可处理多音字的拼音/注音转换系统,用以进行简体中文汉字拼音、繁体中文汉字注音的输入与相互转换,该系统至少包含一数据库加载模块,用以根据一操作系统平台中所使用的一带语音标记的汉字数据库来决定一加载的汉字语音数据库类型;一字符对应关系产生模块,用以根据该数据库加载模块所提供的该加载汉字数据库类型来决定一字符对应关系转换表类型,产生出一对应关系转换数据库;一字符转换模块,用以对一使用者由一输入设备所输入的一字符串进行转换,即根据该字符对应关系产生模块提供的该对应关系转换数据库,产生一转换后的对应字符组;一多音字转换模块,用以接受该字符转换模块传送来的一多音字处理需求,进行相应的转换处理;以及一输出模块,用以接受该字符转换模块以及该多音字转换模块传送的一转换后的字符组,将该字符组输出至一输出设备当中。本专利技术的上述目的是这样实现的一种可处理多音字的拼音/注音转换方法,用以进行简体中文汉字拼音、繁体中文汉字注音之间的输入与转换,该方法至少包含下列步骤在一计算机可执行的操作系统平台上加载一汉字数据库;根据加载的该汉字语音数据库,决定一对应关系转换表类型;根据该对应关系转换表类型,决定一对应关系转换数据库类型;接受一使用者由一输入设备输入一字符串;判断该字符串是否属于一汉字字符串及是否需要一多音字处理;根据该使用者自行选择一多音字所需要的正确发音符号;根据该字符对应关系转换表将该字符串转换产生一转换后对应字符组;根据该转换后对应字符组输出至一输出设备;及根据判断该字符串的结果决定一结束操作。由此可见,本专利技术所述的,首先提供“汉语拼音/注音”对应关系转换表,使我们可以在系统中只需要通过一套对应的汉字语音数据库,即可实现在一个操作系统平台中,进行简体中文汉字拼音、繁体中文汉字注音的输入和转换,进而达到汉语拼音/注音的自动转换功能。这样的方式不但可以节省所需要的硬件空间,同时也降低了人工输入数据库的成本,减少发生不必要的错误,提高了执行的速度。此外,由于在本专利技术所述的“汉语拼音/注音”对应关系转换表中,具有可处理多音字的特殊对应关系,因而可以使得本系统及方法在不使用转换运算法则(Algorithm)、不使用其他词库的情况下,即能够处理汉语拼音/注音转换过程中的多音字的多种发音,解决了过去传统简体中文汉字拼音、繁体中文汉字注音的输入与转换的过程中,无法有效处理多音字的问题。本专利技术提出了一种,主要应用于计算机可执行操作系统平台上,用以提供简体中文汉字、繁体中文汉字之间汉语拼音和注音的输入与转换的系统及方法,同时还可根据对应关系转换数据库中特定内容实现对多音字的处理。本专利技术以一较佳实施例说明本方法的具体可行性,附图说明图1为本专利技术所述的的功能模块图,其主要的系统功能模块包含(1)数据库加载模块101;(2)字符对应关系产生模块102;(3)字符转换产生模块103;(4)多音字转换模块104;及(5)输出模块105。(1)数据库加载模块101用以根据操作系统中所使用的汉字数据库来决定欲为系统加载的汉字数据库的型。(2)字符对应关系产生模块102用以根据数据库加载模块101所提供的加载汉字数据库的类型来决定内部的字符对应关系转换表类型,产生对应关系转换数据库。(3)字符转换产生模块103用以接收使用者由输入设备输入的字符串,并对其进行转换,根据字符对应关系产生模块102所提供的对应关系转换数据库,产生转换后的对应字符组。(4)多音字转换模块104用以接收字符转换产生模块103传送的多音字处理需求,并对多音字部分作相应的转换处理。(5)输出模块105用以接收由字符转换产生模块103以及多音字转换模块104传送的转换后的字符组,并将此字符组由输出设备输出。请参阅图2,图2为本专利技术所述的处理多音字的拼音转换系统及方法的整体流程图,说明本系统主要的方法如下首先,我们必须在所使用的系统操作平台上加载一套带语音标记的汉字数据库(步骤201),这套汉字数据库的类型可以是“汉字/汉语拼音”的对应数据库也可以是一套“汉字/注音”的对应数据库。接着,本系统会根据在系统操作平台中所加载的汉字数据库的类型,由本系统所提供的字符对应关系产生模块102,来决定本系统内部所要建立的字符对应关系转换表(步骤202),而这一字符对应关系转换表可以是“汉语拼音-注音”或者是“注音-汉语拼音”的内部字符对应关系,然后再依据模块102所决定的内部字符对应关系,产生对应关系转换数据库(步骤203),也就是“汉语拼音-注音”对应关系转换数据库或者是“注音-汉语拼音”对应关系转换数据库。当使用者由输入设备输入一欲转换的文字字符串(步骤204)时,本系统所提供的字符转换产生模块103会首先判断使用者所本文档来自技高网...

【技术保护点】
一种可处理多音字的拼音/注音转换系统,用以进行简体中文汉字汉语拼音、繁体中文汉字之间注音的输入与转换,其特征在于该系统至少包含:一数据库加载模块,用以根据一系统操作平台中所使用的一带语音标记的汉字数据库来决定一欲为系统加载的带语音标记的 汉字数据库的类型;一字符对应关系产生模块,用以根据该数据库加载模块所提供的该加载的汉字数据库的类型来决定一字符对应关系转换表类型,产生一对应关系转换数据库;一字符转换产生模块,用以接收一使用者由一输入设备输入的一字符串,并对其进行转 换,根据该字符对应关系产生模块提供的该对应关系转换数据库,产生一转换后的对应字符组;一多音字转换模块,用以接收该字符转换产生模块传送的一多音字处理需求,并对多音字部分作相应的转换处理;以及一输出模块,用以接收由该字符转换产生模块以及 该多音字转换模块传送的一转换后字符组,并将该字符组由一输出设备输出。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:林光信夏强
申请(专利权)人:英业达股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1