新单词自动学习方法及装置和文字输入系统制造方法及图纸

技术编号:2821849 阅读:165 留言:0更新日期:2012-04-11 18:40
公开了一种适用于包括单词词典的对象语言文字输入系统的新单词自动学习方法,包括:采集步骤,从输入的对象语言语料中采集新单词词典和单词词典中没有的字串作为采集字串,所述新单词词典用于保存所述单词词典中没有的单词;第一保存步骤,将所述采集字串中没有存在于临时新字串词典中的采集字串作为临时新字串保存在临时新字串词典中,以及将存在于所述临时新字串词典中但没有存在于新字串词典中的采集字串作为新字串保存在新字串词典中;以及第二保存步骤,在利用对象语言文字输入系统进行对象语言文字输入过程中用户选择被作为输入候选项呈现的、所述新字串词典中的新字串时,将该新字串作为新单词保存在所述新单词词典中。

【技术实现步骤摘要】

本专利技术涉及文字输入,具体涉及一种用于对象语言文字输入系统 的新单词自动学习方法及使用该方法的装置以及使用该方法的文字输 入系统,能够提高诸如中文或者日文的输入效率,并且适用于诸如手 机之类便携式信息终端。
技术介绍
西文之外的文字,诸如中文和日文之类的东方文字,向计算机之 类数字设备的输入是长久以来困扰人们的问题。为了解决计算机处理 中文的问题,已经开发出了各种各样的文字输入方法,来提高信息处 理的自动化水平。为了提高文字输入效率,部分的文字输入方法支持在输入过程中 学习新单词。通常有两种学习新单词的方法, 一种是手动添加新单词 的方法,另一种是自动新单词学习方法。现有的手动添加新单词的中文新单词学习方法的一个例子是微 软中文输入法。在输入过程中,用户打开中文输入系统自带的新单词 学习专用软件,把遇到的新单词添加到中文输入系统所维护的词典中, 从而在下次遇到该单词时,就可以在候选条目中出现该单词,便于用 户选择。现有的手动添加新单词的中文新单词学习方法的另一个例子是陈 桥输入法。根据该方法,用户也可以在中文输入时使用键盘上的按键 作为辅助键标出新单词的起始位置和终止位置后,中文输入系统对所 标出的新单词进行记录,供以后用户输入时使用。中国专利申请CN94104905.1和CN94106045.4披露了一种自动中 文新单词学习方法。在该方法中,把出现的新单词全部学习记录下来,当用户输入新字串时,将新字串记录为新单词,以后累计计算用户对 新单词的使用频度,保留使用频度高的新单词,删除那些使用频度低 的新单词。上述中文输入系统可以永久保存新单词。自动中文新单词学习方法的另一个例子是紫光拼音输入法。根据 该方法,把出现的新单词暂存在机器内存中,累计计算新单词的使用 频度,并根据该使用频度调整新单词作为输入候补的顺序,供用户选 择使用。很明显,手动中文新单词学习方法不能在用户连续输入中文的同 时全自动地完成新单词的学习。在新单词的学习过程中,用户要进行 一些手动操作辅助中文输入系统完成新单词的学习,给用户造成了负 担,降低了中文输入的效率。另外,现有的自动新单词学习方法都应用于可一次进行2个以上 汉字字串的拼音或其他文字代码的变换的输入模式下的。即,用户一 次输入对应2个汉字以上的字串的拼音串或其他文字代码串,然后选 择相对应的汉字,依靠该拼音串或其他文字代码汉字串和所输入的汉 字串的对应关系进行新单词学习。但是,在应用于嵌入式设备、移动终端等的单汉字输入系统(单 汉字输入系统中,用户每次只能输入对应一个汉字的拼音、笔画或者 其他代码,进行一个汉字的转换。单字输入法主要出现于一些嵌入式设备,移动终端中,单字输入方法的一个例子是手机里使用的T9输 入法)中,每次都以单个汉字的拼音或其他文字代码进行汉字变换, 不存在连续输入两个以上汉字的拼音串或其他文字代码串的情况,依 靠拼音串或其他文字代码串和汉字串的对应关系进行单词学习的现有 的自动中文新单词学习方法无法应用于单汉字输入系统中进行单词学 习。再者,现有的自动新单词学习方法将词典中没有的字串立即存入 词典中,在作为输入候补使用,依靠对新单词作为输入候选项被选用 的次数的累计,判断该新单词在词典中被继续保留或删除,当用户输 入不经常使用的新单词、甚至只是无意义的2个汉字以上的字串时, 现有的方法都会把它们当作新单词存入词典中,作为输入候选项选用。7这样,词典和输入候选项中会出现很多不经常使用或无意义的字串, 影响中文输入系统的处理效率和用户选择输入候选项进行输入的效率。
技术实现思路
要解决的技术问题鉴于上述问题,完成了本专利技术。本专利技术的目的在于提供一种新单 词自动学习方法及其装置和文字输入系统,能够提高诸如中文或者曰 文之类的对象语言文字的输入效率,并且适用于诸如手机之类便携式 信息终端。解决技术问题的手段在本专利技术的一个方面,提供了一种适用于包括单词词典的对象语 言文字输入系统的新单词自动学习方法,包括采集步骤,从输入的 对象语言语料(material)中釆集新单词词典和单词词典中没有的字串 作为采集字串,所述新单词词典用于保存所述单词词典中没有的单词; 第一保存步骤,将所述采集字串中没有存在于临时新字串词典中的采 集字串作为临时新字串保存在临时新字串词典中,以及将存在于所述 临时新字串词典中但没有存在于新字串词典中的采集字串作为新字串 保存在新字串词典中;以及第二保存步骤,在利用对象语言文字输入 系统进行对象语言文字输入过程中用户选择被作为输入候选项呈现 的、所述新字串词典中的新字串时,将该新字串作为新单词保存在所 述新单词词典中。优选地,所述采集步骤包括用连续输入的对象语言语料中的特定字符将所述对象语言语料切分为段(segment);以及将与新单词词 典和单词词典中的单词不同的段作为采集字串来保存。优选地,所述特定字符包含除了对象语言文字之外的字符和单字 成词的对象语言文字的至少之一。优选地,所述第一保存步骤包括在新字串词典没有保存所述采 集字串的情况下,将所述采集字串和临时新字串词典的字串相比较; 在临时新字串词典没有保存所述采集字串的情况下,将所述采集字串作为临时新字串词典保存入临时新字串词典;以及在临时新字串词典保存有所述采集字串的情况下,将所述采集字串作为新字串保存入新 字串词典,并将所述临时新字串从临时新字串词典中删除。优选地,所述新字串词典保存的新字串作为对象语言文字输入系 统的输入候选项来呈现给用户。优选地,所述新字串词典中存储了与所述新字串一一对应的新字 串标志位,并且所述新字串标志位具有预设的初始值。优选地,所述第二保存步骤还包括在用户选中其他输入候选项作为输入单词的情况下,将所述新字 串标志位的值增加或减少预定数。优选地,所述第二保存步骤还包括在用户选中其他输入候选项 作为输入单词的情况下,将所述新字串标志位的值增加或减少预定数 目。优选地,所述新字串标志位的值为预定值时,将该新字串从新字 串词典删除。优选地,在用户不断输入对象语言语料的周时自动进行新单词的 学习。优选地,统计并保存所述采集字串,临时新字串,新字串,新单 词的词频。优选地,所述输入候选项是以词频来排序的。在本专利技术的第二方面,提供了一种新单词自动学习装置,适用于 包括单词词典的对象语言文字输入系统,所述新单词自动学习装置包括显示单元,显示所述对象语言输入系统作为对象语言语料输出的 对象语言字串、以及所述输入的字串的一个以上的其他变换结果的候 选字串;新单词词典,存储所述单词词典中没有的单词;字串采集单 元,在所述变换后的对象语言语料中采集单词词典和新单词词典中没 有的字串;临时新字串词典,将由所述字串采集单元采集的采集字串 中没有存在于新字串词典和临时新字串词典中的采集字串作为临时新 字串进行保存;新单词词典,将由所述字串采集单元采集的采集字串 中存在于临时新字串词典中但没有存在于新字串词典中的采集字串作为新字串进行保存;第一保存单元,将由所述字串采集单元采集的采 集字串中没有存在于临时新字串词典和新字串词典中的采集字串根据规定的条件保存在临时新字串词典或者新字串词典中;以及第二保存 单元,在用户从显示于所述显示单元的对象语言候选字串中选择的候 选字串为新字串时,本文档来自技高网
...

【技术保护点】
一种适用于包括单词词典的对象语言文字输入系统的新单词自动学习方法,包括:采集步骤,从输入的对象语言语料中采集新单词词典和单词词典中没有的字串作为采集字串,所述新单词词典用于保存所述单词词典中没有的单词;第一保存步骤,将所述采集字串中没有存在于临时新字串词典中的采集字串作为临时新字串保存在临时新字串词典中,以及将存在于所述临时新字串词典中但没有存在于新字串词典中的采集字串作为新字串保存在新字串词典中;以及 第二保存步骤,在利用对象语言文字输入系统进行对象语言文字输入过程中用户 选择被作为输入候选项呈现的、所述新字串词典中的新字串时,将该新字串作为新单词保存在所述新单词词典中。

【技术特征摘要】

【专利技术属性】
技术研发人员:薛俊吴波吴亚栋
申请(专利权)人:夏普株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利