当前位置: 首页 > 专利查询>周连惠专利>正文

一种输入生僻字的方法技术

技术编号:13044574 阅读:172 留言:0更新日期:2016-03-23 13:30
本发明专利技术公开了一种输入生僻字的方法,属于计算机信息处理技术领域。为解决现有技术输入生僻字难以掌握,简化输入规则又会产生大量的生僻字选项,需要多次的翻页才能找到要输入的生僻字的问题,包括以下步骤:步骤1:用户输入;步骤2:调取生僻字集合并显示;步骤3:用户选择生僻字上屏。本方法适用于计算机终端或智能手机终端输入生僻字。

【技术实现步骤摘要】

本专利技术具体涉及一种输入生僻字的方法,属于计算机信息处理

技术介绍
汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。另外有些字典收字也较多,如清朝的《康熙字典》收字47035个;日本的《大汉和字典》收字48902个,另有附录1062个;台湾的《中文大字典》收字49905个;《汉语大字典》收字54678个。20世纪已出版的字数最多的是《中华字海》,收字85000个。在汉字计算机编码标准中,Unicode的中日韩统一表意文字基本字集则收录汉字简体、繁体及日语、韩语汉字共20902个,另有两个扩展区,近七万字。事实上,汉字数量要远远超过7万字,北京国安咨讯设备公司汉字字库收录了91251个汉字;而日本的《今昔文字镜》收录了近15个汉字。输入法(InputMethod)指的是输入编码方式而不是实现文字输入的软件;如中文输入法中广泛使用的汉语拼音方案以及台湾使用注音符号,都能够作为汉字输入法的编码方式,从而形成能够录入汉字的拼音输入法或注音输入。拼音输入法相比其他输入法有着天然的优势,因为,现代每个接受教育的中国人在还没学习汉字前,就先用大量时间学习汉语拼音或注音符号,原本标记汉字的拼音也就可以轻松地作为汉字的输入编码;拼音输入法另一个优势就是接近口语,所以拼音输入法可以在短时间内适应。但是拼音输入法有着致命的弱点,就是汉字输入法编码时,单字重码率相当高,即使词组重码率也是非常高。在输入汉字过程中,常常要翻很多页,才能找到需要的汉字,输入效率非常低下导致但大部分用户的不满。输入法编辑器(InputMethodEditor)是一种程序,能使用户用“104键”的标准键盘,输入亚洲语言中数以千计的字符;IME用来存放系统输入法文件包括输入法程序、字典/词库(用于表意字的组成)、编码方案。当用户输入键击时,IME引擎会尝试确定应将键击转换成哪个(哪些)字符。多数中国人认识的汉字数量在4000个左右,含国标一级3776个和部分国标二级汉字;因此4千字之外的几乎都是生僻字,所谓生僻字,就是多数人不知道这些字正确的读音及释义,因此很难用拼音输入法在计算机/智能手机上输入它们,这对于古籍文献的整理,以及汉字的信息化是一个巨大瓶颈。根据GB18030-2000,合体字有以下结构:1.左右结构、左中右结构;2.上下结构、上中下结构;3.全包围结构;4.向上包围结构、向下包围结构;5.向右包围结构、向右上包围结构、向右下包围结构;6.向左下包围结构;7.嵌套结构;在中文拼音输入法状态下,要输入生僻字是非常困难的,如果要查字典,这样会中断输入,降低效率;如果凭猜测,有可能读音错误,如“埭”字,多数人可能会误读为“隶(li)”,但事实上,该字的正确读音是“dài”,这样的现象屡见不鲜。申请号为200710065842.5的中国专利《一种汉语拼音输入法》,针对“左右结构、上下结构、左中右结构、上中下结构”等合体字,提供了输入方法比如“玺(尔+玉)”的,采用“eryu?”输入;对于“汉字+部首/部件”结构的生僻字,通过输入“成字部件的全拼加上非成字部件拼音的第一个音节”来实现,如果非成字部件拼音多于一个,则选取任一个简单的非成字部件拼音的第一个音节,非成字部件拼音的读音规则根据国家标准;例如“菝(bá)”字由“拔”字和“草字头(cao)”,输入“bac?”,找到“菝”字。在实际使用中,有些问题,因为有些人不知道国家标准的非成字部件的正确读法,也就无法知道其拼音编码,如“氐”字上的部件“罒”,估计多数人不太清楚如何读;而如果不输入非成字部件的读音编码,就会产生大量的重码生字;为了视觉友好性,目前输入法的输入窗平均显示5-7个候选字,通常需要不断的翻屏才能找到目标生僻字,如果是10万字,其重码生僻字的数量可想而知。由于人们可能不知道所有组成生僻字的成字部件的全拼或非成字部件的汉语拼音,仍然很难输入生僻字,如果在输入法系统中简化输入规则,直接按组成生僻字的成字部件的全拼或非成字部件拼音的一个部分选择生僻字,将会产生大量的生僻字选项,需要多次的翻页才能找到要输入的生僻字。这种方法,对于拼音组合比较少,且生僻字选项较少的情况比较适用
技术实现思路
因此,本专利技术针对现有技术输入生僻字难以掌握,简化输入规则又会产生大量的生僻字选项,需要多次的翻页才能找到要输入的生僻字的问题,提供一种输入生僻字的方法,所述方法包括以下步骤:步骤1:用户输入用户激活生僻字输入法系统,输入要输入生僻字的一个成字部件的全拼或非成字部件拼音,所述生僻字输入法系统内,所有汉语拼音相同的成字部件的全拼或非成字部件拼音组成的生僻字组成一个生僻字集合,在一个生僻字集合内,成字部件的全拼或非成字部件拼音相同的生僻字组成生僻字子集;步骤2:调取生僻字集合并显示生僻字输入法系统的输入法程序根据步骤1输入的汉语拼音调取对应的生僻字集合,并将所述生僻字集合内的所有生僻字子集进行编号并显示在输入界面内;步骤3:用户选择生僻字上屏用户根据基本字选择对应的生僻字子集并按其编号对应的数字键,输入界面内显示选择的生僻字子集的所有生僻字并对其中每个生僻字进行编号,用户按要选择的生僻字的编号对应的数字键,要选择的生僻字上屏。进一步的,所述步骤2中生僻字子集竖向排列并按顺序编号。进一步的,所述步骤3中生僻字竖向排列并按顺序编号,每个生僻字后面标注其读音及对应的通假字等标注信息,所述标注信息只用于标注,不随生僻字上屏。本专利技术的有益效果在于:绝大多数生僻字是由两个或两个以上的成字部件或非成字部件组成的,用户只要知道其中的一个成字部件或非成字部件的汉语拼音,输入后就可以利用本专利技术的方法,先选择生僻字子集,再选择生僻字,避免了大量的翻页查找工作,生僻字输入准确方便且速度快,本方法也可以用于常用汉字输入,但是普通的输入法一般包括了常用汉字字库,每个汉语拼音对应的选项并不多,因此本专利技术更适合生僻字的输入,尤其适合于计算机终端进行古籍文献的整理时使用,也可用于智能手机终端,满足一些用户喜欢使用生僻字的需求。附图说明图1是输入“vba”显示的示意图图2是按键“3”的示意图图3是程序流程图。具体实施方式下面结合附图对本专利技术的具体实施方式进行说明:如图1所示,一种输入生僻字的方法,包括以下步骤:步骤1:用户输入在计算机终端或智能手机终端,用户激活生僻字输入法系统,通过键盘,输入拼音“vba”,生僻字输入法系统内,所有汉语拼音为“ba”的成字部件的全拼或非成字部件拼音组成的生僻字组成一个生僻字集合,在一个生僻字集合内,成字部件的全拼或非成字部件拼音相同的生僻字组成生僻字子集,包括“罷、本文档来自技高网
...

【技术保护点】
一种输入生僻字的方法,所述的生僻字是国标一级3775之外的全部汉字包括日本汉字及韩国汉字,并且生僻字的结构是“通用字+非成字部件”,其中通用字是国标1级和2级的6780个汉字之中的简体字/繁体字或者异体字,其特征在于,所述生僻字中,具有相同汉语拼音的“通用字”的生僻字,组成一个生僻字集合,在该集合内,包括同一个通用字构成的生僻字,组成一个生僻字子集;所述的方法包括以下步骤:步骤1:用户输入用户激活生僻字输入法系统,输入“v”后,连续输入所述的生僻字包括的“通用字”的拼音的全拼编码;步骤2:调取生僻字集合并显示输入法读取生僻字集合,并将由同一个通用字构成的生僻字子集编号、排序并显示在输入界面内;步骤3:调取生僻字子集并显示用户键入某候选数字键,该候选数字编号在步骤2的输入界面对应的同一类生僻字子集内的全部生僻字进一步显示在输入界面内,而且所述的每一个生僻字被全部编号、排序;步骤4:用户选择生僻字上屏用户键入某候选数字键,步骤3的输入界面内对应的生僻字上屏。

【技术特征摘要】
1.一种输入生僻字的方法,所述的生僻字是国标一级3775之外的全部汉字包括日本汉字
及韩国汉字,并且生僻字的结构是“通用字+非成字部件”,其中通用字是国标1级和2
级的6780个汉字之中的简体字/繁体字或者异体字,其特征在于,所述生僻字中,具有
相同汉语拼音的“通用字”的生僻字,组成一个生僻字集合,在该集合内,包括同一个
通用字构成的生僻字,组成一个生僻字子集;所述的方法包括以下步骤:
步骤1:用户输入
用户激活生僻字输入法系统,输入“v”后,连续输入所述的生僻字包括的“通用
字”的拼音的全拼编码;
步骤2:调取生僻字集合并显示
输入法读取生僻字集合,并将由同一个通用字构成的生僻字子集编号、排序并显示
在输入界面内;
步骤3:...

【专利技术属性】
技术研发人员:周连惠
申请(专利权)人:周连惠
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1