汉语发音符号/汉字变换装置及方法制造方法及图纸

技术编号:2892681 阅读:212 留言:0更新日期:2012-04-11 18:40
本发明专利技术为汉语发音符号/汉字变换装置,允许用拼音符号表示法及注音符号表示法输入。用拼音法输入的数据使用拼音/音码变换表,用注音法输入的数据使用注音/音码变换表,分别变换成对应的音码。在词典中对应于音码串存储着汉字码。从输入数据作成音码串。通过筛选程序掩蔽筛选音码中的某些字节,比较该输入音码列的各音码与词典中的音码串的音码。通过比较,从词典中读出与一致的音码串相对应的汉字码,显示出与该汉字码相对应的单词。(*该技术在2012年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及将从键盘输入的汉语发音符号变换成与其对应的汉字后输出的装置及方法,特别是涉及适合于汉语用的文字处理机或桌面系统等使用的装置及方法。汉语是用汉字书写表现的。有几种用符号表示汉字发音的方法。其具有代表性的方法是中国政府于1958年公布的拼音(pinyin)法,以及在此之前就使用的、现在台湾仍在使用的注音(ZhuYin)法。一个汉字的发音可分为相当于子音的声母(ShengMu)和相当于母音的韵母(YunMu),以及表示抑抵的四声(SiSheng)或声调(ShengDiao)。韵母和声母合在一起就是该汉字的读音。在汉字的发音中,也有的汉字没有抑抵。一个汉字的发音由一个以下(一个或零个)声母和一个韵母(根据需要,还可用声调)来表示。声调有以下四种一声(YiSheng或1Sheng)是平坦的高音,用“-”表示。二声(ErSheng或2Sheng)从低音上升到高音。用“/”表示。三声(ShanSheng或3Sheng)从高音到低音,再到高音。用“∨”表示。四声(SiSheng或4Sheng)从高音下降以低音。用“\”表示。例如用拼音法书写“中国”这两个汉字时,则写作“ZhongGuo′”。其中“Zh”和“G”是声母,“ong”和“uo”是韵母。另外,用拼音法书写“日本”这两个汉字时,写作“RiBen”。其中“R”及“B”是声母,“i”及“en”是韵母。汉字文字处理过去从来只允许输入拼音符号。因拼音法是一种较新的方法,因此虽然知道注音法,但不知道拼音法的人仍然很多。因此,要使更多的人能使用汉语文字处理机,就必须允许按注音法输入才行。另外,拼音法的书写方法是以北京话作为普通话确定的。在辽阔的中国,有的口音与北京话的声调不同。在不同的地区,甚至声韵也与北京话不同。因此,不会说作为普通话的北京话的人或者不熟悉北京话的人,就很难正确地输入声韵和声调,经常错误地输入。即使是会说北京话的人,不仅要一边想到声调的区别,一边发音,而且还必须一边联想或考虑声调,一边进行文字处理机的输入操作,不仅输入操作繁杂,而且有时不能输入正确的声调。以往的汉语字处理机,只有当正确地输入声韵和声调时,才能输出与其对应的正确的汉字,如果输入错了,就得不到正确的汉字。本专利技术的目的是汉语发音符号/汉字交换装置中,使用包括拼音书写法和注音书写法在内的多种书写方法中的任何一种,都可以输入发音。本专利技术的另一个目的是即使不输入声调,或者即使声调输入错了,也能获得包括所要求的汉字在内的候选汉字。本专利技术的再一个目的是如果发音多少有点正确,就能检出与包括该发音部分的发音相对应的候选汉字。本专利技术的第一个特征是本专利技术的汉语发音符号/汉字变换装置是一种可以按照多种汉语发音表示方法进输入的输入装置,上述输入装置中分别设有可能输入的数据变换成与该输入数据表示的发音相对应的音码的多种变换表以及能够将音码与其所表示的发音的汉字相互对应存储的词典,还有能利用上述几种变换表中的任意一种,将从上述输入装置输入的数据变换成音码,并从上述的词典中检索出与所变换成的音码相对应的汉字码的控制装置。为了采用乐于使用的输入方式,本专利技术的装置还设有能够从几种表示法中任选一种输入方式的选择装置。然后利用该方式选择装置选定的与表示法相对应的变换表,将输入的数据变换成音码。还可以根据上述输入装置输入的数据,自动判断表示方法,根据判断的结果,选择应该使用的变换表。还可以将上述输入装置设置成一种能够将输入的声音变换成电信号的装置、以及根据声音电信号识别发音、并将输入的声音变换成音码的声音识别装置。本专利技术的装置用于汉语文字处理机时,还设有将所检出的汉字码变换成表示该汉字码所示的汉字的显示数据的装置,以及根据显示数据显示汉字的装置。该装置还设有从所显示的候选汉字中选下任意一个汉字的指定输入装置,以及存储表示所指定的汉字的汉字码的存储器。为了适用于更现代的文字处理机,将上述各变换表设计成能够将单个汉字的输入数据变换成音码。与此对应,上述的词典是将一个汉字或数个汉字构成的单词的音码串与汉字码相对应存储的构成的。由上述输入装置输入的一系列输入数据,按单个汉字分区,并变换成音码。经过变换后的一个或几个音码排列成单词单元,构成音码串。再从上述词典中检出与该音码串相对应的汉字码。本专利技术是建立在能使一个音码对应于一个发音(汉字的读音)的见解基础上的。即使存在拼音符号表示法、注音符号表示法等多种表示方法,如果用这些符号表示法表示的发音是同一个音的话,就必然可以收敛成一个音码。因此,作为汉字(或单词)词典,只要有用音码能进行检索的装置就够了。这样一来,按照本专利技术,可以用多种表示法中的任意一种输入发音,所输入的发音就会转换成具有这个发音的汉字。在本专利技术的实施状态下,即使输入的声调不正确,或发音符号多少有些错误,也能获得包括所要求的汉字在内的候选汉字。因此,在本专利技术的装置中还备有对构成音码的某一个或数个比特进行掩蔽筛选的装置。于是,采用上述控制装置,对与输入数据相对应的音码和上述词典中的音码进行筛选、加以比较,从上述词典中检出与输入数据相对应的音码一致的音码。本实施状态的特征,根据下述本专利技术的第二个特征的观点,便能够充分了解。本专利技术的第二个特征是,汉语发音符号/汉字变换装置具有将输入的表示汉语发音的数据变换成与该码相对应的音码用的变换装置,使音码与表示具有用该音码表示的发音的汉字的汉字码相互对应存储的词典,通过掩蔽筛选选出构成音码的某一个或数个比特的掩蔽筛选装置。利用上述筛选装置选出后,对从上述变换装置获得的音码与上述词典中的音码相互比较,从上述词典中检出与从上述变换装置中获得的音码相一致的音码,再从上述词典中读出与一致的音码相对应的汉字码的控制装置。在某一种输入方式下,在上述音码的结构中含有表示声母的字节、表示韵母的字节和表示声调的字节。在这种情况下,上述的筛选装置作为掩蔽表示声母的字节、表示韵母的字节或表示声调的字节的装置之用。上述筛选装置应理解为包括使音码原样不动地直接通过的装置。根据需要,还可设置选择是否使用筛选装置,或在几种筛选装置中任选一种检索方式的筛选装置。如上所述的本专利技术的第一个特征,还可设置按照多种表示法可输入汉语发音的输入装置。这时,上述变的装置可分别设置能够利用上述输入装置输入的多种表示方法,而且备有能将按照各种表示法输入的数据变换成与由该输入数据表示的发音对应的音码用的数种变换表。还可以设置根据声音输入信号识别发音、并输出与该音相对应的音码的声音识别装置,用来代替上述输入装置和变换装置。为了适用于更现代化的文字处理机,可设置将读出的汉字码变换成表示该汉字的显示数据装置、根据显示数据显示汉字的装置、从所显示的候选汉字中指定任意一个字的指定装置,以及将表示所指定的汉字的汉字码存储起来的存储器。再者,上述变换装置的结构是将单个汉字的输入数据变换成音码,与对应,上述词典的结构能够将由单个汉字或数个汉字构成的单词的音码串与汉字码对应存储。于是,一系列的输入数据按各单个汉字的区位划分,并变换成音码,变换后的一个或数个音码排列成单词单元,构成音码排列。从上述词典中检出与该音码排列相对应的汉字码。如果采用本专利技术,在进行筛选后,对表示输入数据的音码与词典中的音码进行比较。不管是否一致,音码部分(一个本文档来自技高网...

【技术保护点】
汉语发音符号/汉字变换装置,具有可按数种符号表示法输入汉语发音的输入装置;针对用上述输入装置可以输入的多种符号表示法分别设置的多种变换表,用来将按照各种符号表示法输入的数据变换成与由该输入数据表示的发音对应的音码;使音码与表示具有该音码所示音的汉字的汉字码互相对应存储的词典;以及利用上述数种变换表中的任意一种,将由上述输入装置输入的输入数据变换成音码,从上述词典中检索与交换后的音码相对应的汉字码的控制装置。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:仲兴国
申请(专利权)人:欧姆龙株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1