汉语输入变换处理装置及汉语输入变换处理方法制造方法及图纸

技术编号:2888304 阅读:133 留言:0更新日期:2012-04-11 18:40
通过输入部用拼音输入至少具有2个文字程度的读音,控制部通过辞典检索处理部及最前面读音抽出处理部进行辞典检索。辞典检索处理部从单词辞典中把与输入拼音相符的单词作为变换候补检索并抽出。另外,最前面读音抽出处理部从最前面读音位置.全读音对应辞典把具有作为其读音的一部分的同一输入拼音的单词作为变换候补检索抽出。控制部利用文字个数等确定该抽出的各变换候补的输出顺序,并按照其输出顺序将上述各变换候补输出到输出部。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及作成汉语文件时所使用的汉语字处理等,特别是涉及在用拼音输入文字个数较多的单词的读音时使用的、便利的汉语字处理等。过去的汉语字处理等汉语输入变换处理装置使用汉语汉字和表示其读音的表音符号(以下称为拼音)一一对应的汉语辞典,具有用拼音输入汉语的读音,并将之变换成汉字输出的功能。这种功能称为拼音汉字变换功能(相当于日语字处理的假名汉字变换功能)。作为涉及这样的拼音汉字变换功能的现有技术,如日本特许出愿59-25892号公报、或日本特许出愿62-192086号公报等所记载的技术已众所周知。日本特许出愿59-25892号公报披露了对3个文字以上的单词情况,即只输入拼音文字列的最前面子音部(声母)并将其变换成所期望的单词的技术。日本特许出愿62-192086号公报披露了对3个文字以上的单词情况,即第1个文字全部输入拼音文字列,第2个文字以后只输入拼音文字列的最前面子音部(声母)并将其变换成所期望的单词的技术。这些现有技术均是通过只输入汉语单词读音的一部分(最前面子音部等)来检索出相符的单词的技术。此外,为防止变换候补单词过于增加,还对3个文字以上的单词进行了限定。通过使用这些技术,通常认为其可达到削减因长的拼音文字列而产生的敲击键盘次数,能具有更快速地进行输入的效果。但是,1个音节由子音和母音构成,在人类的思考中,是在完全发出该“子音+母音”后,再开始判断发出的是哪一个音节。这是自然语言共同的特征,汉语也决不例外。另外,因为汉语是1个汉字=1个音节,所以,完全的音节对语言的理解的作用是极为重要的。因此,象上述各公报所记载的输入方法那样,用单纯地省略拼音的一部分输入的方法反而有成为输入的妨碍之嫌。在汉语中,一个汉字的发音必须为1个音节,1个音节进一步又由被称为“声母”的最前面子音(音节最前面的子音)和被称为“韵母”的除去“声母”以外的部分(有母音、双重母音、鼻音化母音等)构成。此外,还有表示音节的抑扬顿挫的被称为“四声”的声调(类似于日语的音调之类的东西)。声母例b,p,m,f,d,t,n,l,zh,ch,sh,…韵母例a,o,e,i,u,ai,en,ang,iong,…在表示上,与日语的罗马字的子音母音不同,罗马字母长度不是固定的是其特征之一。另外,在汉语的单词中,大多是1个文字到4个文字的单词,具有超过这些文字个数的单词是合成词或名称等,在常用单词中是极少数(根据北京师范大学现代化教育技术研究所的统计结果)。还有,在2个文字以上的单词的情况中,几乎没有同音词(特别是包含有四声时)的语汇,很多情况是由单一含意来确定,这一点与日语的同音词的性质不同。从这种作为读音文字列的拼音字母个数多的情况,或者2个文字以上单词的单一含意性高的情况来看,可以象上述的现有技术那样,考虑较少地输入拼音(如只输入各文字的最前面子音)来变换所期望的单词。但是,全部都采用单纯地舍去其读音的一部分的方法没有充分考虑到用户的已有知识或语言获得等方面的情况。因此,用户可能会反而感到不便,觉得在拼音输入时尽是些相当于音节(=汉字)的最前面子音的字母。这样,单纯地省略作为汉语读音的拼音的一部分进行输入的方法输入效率不好是很明显的,沿着自然语言的观点,要使其更易于使用,这种方法不仅存在不能尽可能地施行灵活对应、而且还存在难于高效地变换所期望的单词的问题。本专利技术鉴于上述现状而产生,目的在于提供能够减轻对文字个数多的单词的拼音输入的负担,并高效地变换所期望的单词的、具有更高性能的输入变换功能的。按照本专利技术观点之一,可提供输入表示汉语汉字读音的拼音,并把所输入的拼音变换成汉字的汉语输入变换处理装置,该装置的特征在于其具有用于用拼音输入至少2个文字读音的输入装置;对于每个单词都保存拼音和与其对应的汉字的单词辞典;从上述单词辞典中将具有作为其读音的一部分的由上述输入装置输入的拼音的单词作为变换候补来检索的辞典检索装置;输出上述辞典检索装置所检索出来的变换候补的输出装置。按照这样的构成,通过用拼音输入至少2个汉字程度的读音,可从辞典中抽出具有作为其读音的一部分而输入的拼音的单词,并作为变换候补输出。因此,即使是文字个数多(拼音读音长)的单词,也能减少其输入次数而高效地进行变换。另外,在上述汉语输入变换处理装置中,上述辞典检索装置也可以从上述单词辞典中把最前面部分具有上述输入拼音的单词作为变换候补来检索。按照这样的构成,如把“卧薪尝胆”说成“卧薪”那样,通过用拼音输入单词读音的最前面部分(最前面2个文字),可以作为变换候补得到所期望的单词。还有,在上述汉语输入变换处理装置中,上述辞典检索装置还可以从上述单词辞典中把预先指定的位置处具有上述输入的拼音的单词作为变换候补进行检索。按照这样的构成,可以进一步扩大单词读音的适应范围,如把“北京大学”说成“北大”、把“文化大革命”说成“文革”那样,通过用拼音输入单词读音的指定部分(长单词的简称或通称的读音),可以作为变换候补得到所期望的单词。根据本专利技术另外的观点,可以提供输入表示汉语汉字读音的拼音,并把其所输入的拼音变换成汉字的汉语输入变换处理装置,该装置的特征在于其具有用于用拼音输入至少2个文字程度的读音的输入装置;对于每个单词都保存拼音和与其对应的汉字的单词辞典;从上述单词辞典中将符合上述输入装置输入的拼音的单词作为变换候补进行检索的第1辞典检索装置;从上述单词辞典中将具有作为其读音的一部分由上述输入装置输入的拼音的单词作为变换候补进行检索的第2辞典检索装置;确定由上述第1及第2辞典检索装置检索出来的各变换候补的输出顺序的输出顺序确定装置;按照由上述输出顺序确定装置确定的输出顺序输出上述各变换候补的输出装置。按照这样的构成,通过用拼音输入至少2个汉字程度的读音,可以从辞典中分别抽出作为对应所输入的拼音的单词及具有作为其一部分的同一输入拼音的单词,并作为变换候补输出。因此,即使是文字个数多(拼音读音长)的单词,也能减少其输入次数而高效地进行变换。另外,在上述汉语输入变换处理装置中,上述第2辞典检索装置也可以从上述单词辞典中把最前面部分具有上述输入拼音的单词作为变换候补进行检索。按照这样的构成,如把“卧薪尝胆”说成“卧薪”那样,通过用拼音输入单词读音的最前面部分(最前面2个文字),不仅可以把与该输入拼音相符的单词作为变换候补获得,而且还可以作为变换候补得到最前面部分具有同一输入拼音(最前面2个文字)的单词。还有,在上述汉语输入变换处理装置中,上述第2辞典检索装置还可以从上述单词辞典中把预先指定的位置具有上述输入拼音的单词作为变换候补来进行检索。按照这样的构成,可以进一步扩大单词读音的适应范围,如把“北京大学”说成“北大”、把“文化大革命”说成“文革”那样,通过用拼音输入单词读音的指定部分(长单词的简称或通称的读音),不仅可以把与该输入拼音相符的单词作为变换候补,而且还可以作为变换候补得到指定位置上具有同一输入拼音的单词。另外,在上述汉语输入变换处理装置中,上述输出顺序确定装置还可以根据预先设定在作为各变换候补所得到的单词中的频度信息,确定其输出顺序。按照这样的构成,在作为变换候补获得与输入拼音相符的单词和作为一部分读音的同一输入拼音所具有的单词时,可以根据预先设置在这些单词中的频度信息确定输出本文档来自技高网...

【技术保护点】
一种汉语输入变换处理装置,该汉语输入变换处理装置输入表示汉语的汉字读音的拼音,并把其输入的拼音变换成汉字,其特征在于具有: 用于用拼音输入至少具有2个文字程度的读音的输入装置(21); 对于每个单词保存拼音和对应拼音的汉字的单词辞典(27或28); 从上述单词辞典(27或28)中把具有作为其读音的一部分的利用上述输入装置输入的拼音的单词作为变换候补进行检索的辞典检索装置(25或26); 输出利用上述辞典检索装置(25或26)检索的变换候补的输出装置(29)。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:林哲洋中里茂美石冢靖
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1