汉字字符输入的方法和系统技术方案

技术编号:2888068 阅读:181 留言:0更新日期:2012-04-11 18:40
一种计算机汉字输入方法,利用普通或虚拟键盘及汉字信息处理和显示单元,依汉字笔序利用笔划码元输入汉字,其特征包括以下处理方法:在笔划码元输入操作中代替任意笔划码元的智能笔划键;随笔划码元的输入,在显示单元上逐次更新显示预测引导性的依使用频度排序的相应候选汉字及待用汉字部件;随实际输入汉字、词的频度而随机改变相应于输入笔划码元的汉字、词频度排序及相应汉字部件频度排序的随机频度排序显示;输入一个候选汉字后,余下的候选字分为两组显示,一组是相应该输入汉字的相关词组的下汉字,一组是与在先候选字相同的汉字,并用色标区分开,不用空格即可输入联想及非联想汉字的任意候选汉字。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于汉字信息处理
,是一种计算机汉字输入方法及其系统。汉字犹如一个浩瀚的海洋,字量有几万个。许慎的《说文解字》收录有一万多个汉字。公元十九世纪中叶成书的《康熙字典》收录有五万多汉字。今天,绝大多数受过较高教育的人平均掌握几千个汉字。这几千个字构成了现代汉语中的几万个词组和短语。笔画是汉字的基本构形要素。汉字中大约包括三十多种笔画形式。汉字的笔画数目相差很大,可从一画到几十画。三十几种笔画也有大小、长短和位置的不同。较早的机器输入汉字的方法是使用规定的编码。例如,汉字电报电码使用4位数字为9999汉字进行编码。一位经过专门训练的人需要熟练记住所有汉字的编码及其相关的键位。这种方法的一个显著优点是可以盲打,其最大的缺点是操作员必须熟练记住大量的编码数字。每当操作员不知道某一汉字的编码时,必须查找有关内容。这样势必会大大减慢输入的速度。以拉丁字母为书写系统的文字体系相对容易输入,因为其26个字母与打字机键盘上的键位相一致。从手动的打字机键盘向计算机键盘的过度也只不过是一个简单的调整而已。但汉字的情况就完全不一样,把几万个汉字设定在西方26个字母键盘上就不那么简单。汉字输入的的另一种方法是利用汉字字音作为一种中介,即使用汉字的语音符号输入汉字。普通话是现代汉语的标准音。不包括声调,普通话中有400多个不同的音节。因此,普通话中有很多同音字。再加上汉语方言中发音的不同,依靠汉字的语音辨别许多汉字会有一定的困难。显然,一种能够输入全部几万个汉字、能够为广大操作员所掌握的简单、方便、实用、可行的汉字输入方法将十分有益于汉字输入的需要。美国专利第5,109,352号提出一套方案1)把汉字中的笔画归为少数几种基本笔画;2)按照人们书写汉字的笔画顺序序列输入汉字。按照第5,109,352号专利的设想,输入汉字需要的笔画数很多。虽然汉字笔画的书写顺序有一定的规律,但是人们书写具体汉字的笔画顺序有时可能有很大不同。对于含有笔画比较多的汉字,人们书写顺序完全相同的情况并不多。352号专利运用容错的方式解决这一问题。但是过多地允许容错这一补救方法会削弱其功能的独特性。此外,当操作员不知道某一汉字的笔画顺序或笔画时,尤其是当笔画的组合有不止一种的可能时,操作员需要花费一定的时间去试着输入或查阅参考资料寻找。这样会大大影响输入速度。使用部首的输入方法通常含有一种复杂的编码、严格的规则和固定的键盘分配。由于部首主要是为了对汉字进行分类,并不能表述汉字的全貌,有些汉字的主要结构特征则不能显示出来。因此,这种系统通常比较难学、难用。上述的汉字输入系统中编码不统一,记忆量大,难以将汉字的特性和规律同现代科学技术充分地结合起来。因此,难学、难用,难以推广和普及。显然,社会需要一种简单、易学、易用的大众化的汉字输入方法。为了满足这一需要,下面推出一种新研制开发的、理想的汉字输入解决方案。本专利技术的主要目标是提供一种优化的汉字输入方法和系统,它只需很短的学习和训练时间,具有很高的输入效率,而毋需任何外部参考。本专利技术还有以下几个目标1.通过保留操作员对输入词组的思维,给目标装置提供完整的词组以作进一步的字处理,从而保留中文的词组特征;2.通过采纳所输入的汉字或词组的频率,而允许该系统自身针对不同的操作员或小组自动进行优化和修正;3.允许操作员使用部件替代笔画以进一步降低重码率,更精细地分辨出不同的候选字;4.针对先前输入的笔画或部件,系统通过计算部件在所有以该部件作为下一个书写结构的汉字累加频率,从而得到对部件的排序;5.为中文输入系统提供许多与众不同的特色,如毋需在词组之间输入空格,毋需在键盘上贴标签,以及特殊的虚拟键如“延伸键”及“智能键”。在本专利技术中,操作员和输入装置形成一个封闭的反馈回路。操作员对该系统所显示的信息作出反应,并通过键盘或其它手段提供额外的信息或作出决定,操作员的反应在很大程度上取决于他(她)对汉字或由汉字组成的语言的认识程度。该输入装置同时也对操作员所输入的数据作出反应,并显示更多的视觉信息。另外,该装置在下一步操作中的表现会随着上一步操作的不同而变化。该系统可以使用标准键盘或触摸屏作为主要的输入手段。其中大部分的操作同时适应于以上两种输入手段。键盘可以是单手或双手操作的,但双手操作键盘更适合于快速输入,而单手操作键盘则适合于另一只手需要放在原稿上的誊写工作。当用触摸屏作为输入手段时,操作员可以用手指或触摸笔在适当的显示区触摸来替代键盘操作。输入手段可以包括一个传统的键盘,即典型的计算机或打字机键盘。传统的贴在键盘上的标签在这里并不重要。在本专利技术中可以不使用这些标鉴,或把它们用作其它用途,如可以用作拉丁字母、注音符号,日文假名或韩文字符。本专利技术所希望的最佳设计是利用键盘上的一个小突点使右手或左手定位。因为毋需键盘上的标签,除了开始时使手放在适当位置外,也就不需要操作员把目光移到键盘,在这一所希望的最佳设计中,八个手指放在键盘的主键行上,而这主键行的每一个键则对应于八个笔画之一。大拇指可以自由地控制空格键,而双手的小指则可以用来控制“SHIFT”键。这一特色与以往的汉字输入方法有明显的不同。这一手指位置的安排可以使操作员仅使用主键行就可以高速输入笔画。操作员也毋需额外的(昂贵及费时)打字课程来熟悉键盘的编排。本专利技术也包括用于汉字输入的显示方式。如果需要,显示区的其中一部分可以专门用来作为操作员与输入系统在输入汉字时的交互对话。如果当前的操作是输入汉字,则显示区可以与屏幕上其它信息重叠,如与本专利技术有关的显示信息可能与一个字处理软件工具重叠,而该字处理软件需要利用本专利技术输入的汉字。本专利技术同时也包括在屏幕显示用抽象符号代表的笔画、部件以及所支持的字符集中某一汉字的手段。该汉字输入系统包含由程序空制的数值处理器及其存贮手段。它们提供了高速完成本专利技术中的输入/反馈过程所需的设备。本专利技术也使用存放在存贮手段中的数据,这些数据包括与单个汉字特征有关的信息、与单个汉语复合词(词组或短语)特征有关的信息、以及与汉字的部件有关的信息。单个汉字的特征包括(1)书写该汉字所用的笔画编码及顺序。笔画编码与所选择的笔画分类方案相对应;(2)该汉字在操作员所用的语言中出现在词组开头时的频率;(3)该汉字按书写顺序所用的部件;(4)该汉字在所属汉字子集的标记,如简体字、繁体字、日文、韩文、中小学生常用简体字、与简体字相应的繁体形式、俗语或一组随机的字符集。与中文词组特征有关的信息包括(1)该词组在操作员所用的语言中所出现的频率;(2)该词组在所有汉语词组的不同子集的成员标记,如常用普通话词组、地名、人名以及俗语等。汉字在该系统中的内部编码可以是任意的。该系统可以用传统的编码转化方法如码表查找法把内部编码换成外部所需的编码。在本专利技术所希望的最佳的设计中,所支持的所有汉字都按一个“汉字表”中的序数来存放,并可以通过码表查找法转换成各种不同的16比特外部标准编码。以下将根据附图介绍本专利技术的原理附图说明图1A-1C是本专利技术中的笔画及笔画分类,其中图1A列出了用于书写汉字的简单笔画。它们被分成了29种基本形式,再分类成8个及5个基本笔画。图1B列出了29个基本形式及简化后的8个基本笔画之间的对应关系。图1C列出了29个基本形式与进一步本文档来自技高网...

【技术保护点】
一种计算机汉字输入系统,其中包括: a.依汉字笔序利用笔划码元输入汉字的键盘单元或虚拟键盘单元; b.汉字信息处理单元;及 c.汉字及其它相关信息的显示单元;其主要特征在于还包括: (1)在笔划码元输入操作中代替任意笔划码元的智能笔划键处理单元; (2)随着笔划码元的输入,在显示单元上逐次更新显示予测引导性的依使用频度排序的相应候选汉字及相应候选待用汉字部件的处理单元; (3)随实际输入汉字、词的频度而随机改变相应于输入笔划码元的汉字、词频度排序及相应汉字部件频度排序的随机频度排序显示的处理单元; (4)当输入一个候选汉字之后,余下的候选字被分为两组显示,第一组是相应该输入汉字的相关词组的下一个汉字,第二组是与在先候选字完全相同的汉字,并用色标区分这两组,以便不用空格即可输入联想汉字及非联想汉字的任意候选汉字的处理单元。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:华立驰潘贤麟邱卫根
申请(专利权)人:字原加拿大有限公司
类型:发明
国别省市:CA[加拿大]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1