当前位置: 首页 > 专利查询>谢春华专利>正文

进行语言文字录入或翻译的智能转换的方法技术

技术编号:2880436 阅读:226 留言:0更新日期:2012-04-11 18:40
涉及文字录入、语言翻译领域的两套相关处理方案:一种是对编码库采用分级显示、分类切换技术,用以减少重码和不必要的编码干扰的方法,尤其是大量使用“随意乱打字”和“随意乱打词”,能极大地简化拼形输入法的学习难度;另一种是使用拼形输入法时能够利用对所录入文字和击键的跟踪实现智能化的处理自定义词组的方法,从而获得轻松高效而又流畅的录入感觉,并且使用极为方便,是最理想也是最简单有效的自定义词组的处理技术。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术提供一种在利用键盘或类似于键盘的点击的技术进行语言文字录入或将一种语言翻译成另一种语言时为减少重码和不必要的编码干扰进行编码库自动分级显示和分类切换的方法,本专利技术同时还提供一种文字录入的智能自定义词组的方法。目前,利用计算机键盘、手机键盘或有类似功能的屏幕键盘、屏幕图形、屏幕软键盘等进行语言文字录入或者将一种语言翻译成另一种语言,当发生容易错误或允许错误的情况或遇到较冷僻词条时,公知的方法是在编码对应处理时,将容错的编码、译文或较冷僻词条同正常的编码、译文或常用词条一起不加区别的处理。如在用计算机键盘进行中文录入时,五笔字型等拼形输入法通常都设计有容错码,拼音输入法一般都附带有南方模糊音,当选择使用模糊音功能后,若模糊音与标准拼音的编码相同,则能同时显示模糊音和标准拼音对应的字词。但是,目前的拼形输入法采用容错码后存在两个方面的问题,一方面,究竟是容错编码还是正确编码在录入时不易区分,自定义词组时自动产生的编码也不能包含容错码,另一方面,由于用拼形输入法打字有“汉字难以拆分”和“容易发生误拆”等特点,因此希望使用的容错码越多越好,而拼形输入法为了追求低重码率又不允许过多使用容错码。使用拼音输入法,当采用南方模糊音时,虽然可以实现模糊音文字录入,但却带来了大量的重码,即使自己在某些字词上发音正确,也不得不同时接受由于该字词的模糊音带来的重码。大量重码既带来翻页查找的工作量和手、眼、脑的额外负担,又影响录入的速度。同时,在录入文字的时候,常常需要增加一些新的专门的词组,而目前以拼形输入法为代表的一些录入方法在自定义词组时尚没有用智能的手段让计算机自动识别新词的方法。本专利技术的目的是提供一种,在利用计算机键盘、手机键盘或类似键盘功能的屏幕键盘、屏幕图形、屏幕软键盘等进行语言文字录入或者将一种语言翻译成另一种语言时,允许大量使用模糊编码、容错码、冷僻词编码、繁体字编码等“非正常编码”的一种方法,该方法既能避免“非正常编码”与“正常编码”发生干扰,也能避免“非正常编码”相互间发生干扰,本专利技术同时提供一种文字录入的智能自定义词组的方法,在文字录入时,利用输入词条(词库中原来并不存在该词条,该词条也可以不是词组而是人名、地址等任何形式的字组合)时输入的空编码进行记忆,并对随后输入的字、词编码跟踪判断,从而自动获得自定义词组的方法。尤其通过采用以上两个相关方案,能够极大地降低文字录入的学习使用难度,显著提高使用者特别是初学者的工作效率。以上所述的“正常编码”本专利技术称为“主编码”,模糊编码、容错码、冷僻词编码、繁体字编码等各种“非正常编码”统称为“辅编码”。本专利技术的目的是这样实现的尽可能地将辅编码与主编码分开显示,主、辅编码的内容相互间不重复,保证主编码在正常录入时不受辅编码干扰。当辅编码数量较多或者需要进行分类处理时,可以将辅编码进行分组处理,如上述的辅编码经分组处理成模糊编码、容错码、冷僻词编码、繁体字编码等,以保证辅编码之间也尽可能少的发生重码和干扰。在使用辅编码时,只需要一次击键即可实现由主编码库向辅编码库的切换。录入辅编码后自动返回或通过返回键返回。通过返回键返回时,返回键可以采用原来的切换键,也可以采用专门定义的返回专用键。本专利技术所指的击键还包括屏幕类键盘的鼠标点击,手指、笔的触屏点击等。文字录入时智能自定义词组的方法是这样实现的当以一个完整的词组编码录入某词条时,如果该词条在词库中并不存在,则这一编码被自动保存。由于该词条在词库中不存在,因此就需要以单字或更短的词组来输入该词条。经跟踪这些随后输入的单字或短词的编码,再经与保存的编码按构词规则进行比较判断,可识别确认该词条成为一个新的自定义词组。具体举例描述如下。一、用于用拼形的方法录入文字1、主编码采用常用的正确编码,同时允许使用部分常用的非正确编码。在本人专利技术的梦码输入法中,GB2312中所有汉字均作为主编码,极少数疑难字在发生一字多码时,若不与自定义词组发生矛盾,也可用作主编码,如表的正确编码“sztk”和容错码“szak”都可为主编码,臼的正确编码“fags”和容错码“faga”都可为主编码。2、辅编码按所属类别分开处理。①随意乱打单字。随意乱打单字在本专利技术中专指未按主编码库中的正确汉字编码输入却能无干扰地录入该字的技术。梦码输入法将所有的容错字用一个专用的辅编码库来管理,用专用键进行切换。该编码库即为随意乱打字库。比如,专用键选用“[”。当要录入“天”字时,如果按正确编码录入“a;//”(“天”被分解为“一、大”,该编码中“a”指“一”、“;”指“大”、“/”指“编码已取完”),由于在主编码库中有对应的字和编码,因此可以用通常录入汉字的办法录入“天”字。但是,如果操作者发生误拆,通常情况下,就会无法录入该字。现在,操作者还没有很好掌握“字根取大”原理,或者看不清这里的“大”这一字根就是“大字根”,没有优先取“大”这一字根。比如拆成了“sf//”(“天”被分解为“二、人”,该编码中“s”指“二”、“f”指“人”、“/”指“编码已取完”)或者“smj/”(“天”被分解为“二、丿、丶”,该编码中“s”指“二”、“m”指“丿”、“j”指“丶”、“/”指“编码已取完”)。最简单地办法是击专用键“[”(目的是转到随意乱打字库),这就找到了“天”字!因为在随意乱打字库中,“天”字的“随意乱打”编码“sf//”或“smj/”本来就是存在的。由于随意乱打单字的库的容码空间和主编码库的容码空间一样大,因此,只要有可能打错的字,其错误编码都可以当做容错码,而容错码重码的概率却会非常低。比如,用30个键打字时,如果用4码码长来定一字,则主编码库的容码空间是304为81万,容错码的空间也将是81万,在81万的容码空间里装6763个汉字的容错码可谓绰绰有余。②随意乱打词。随意乱打词在本专利技术中专指未按主编码库中词组的编码输入时或想要录入主编码库中根本不存在的冷僻词时,能够录入想要的词组或冷僻词的技术。梦码输入法将所有的容错词和冷僻词再用一个专用的辅编码库来管理,用另一个专用键进行切换。该编码库即为随意乱打词库。比如,专用键选用“]”。当要录入“天堂”一词时,如果按正确编码录入“a;lc”(“天”字的前两个编码取“一、大”,“堂”字的前两个编码取“、冖”,该编码中“a”指“一”、“;”指“大”、“l”指“”、“c”指“冖”),由于在主编码库中有对应的词和编码,因此可以用通常录入汉字词组的办法录入“天堂”一词。但是,按以上的假设,如果“天”字被误拆成了“sf//””或者“smj/”,则“天堂”一词相应地也被误拆成“sflc”或者“smlc”(“天”字的前两个编码由“a;”变为编码“sf”或者“sm”,而“堂”字的前两个编码“lc”保持不变),由于这时处于主编码库,因此按“sf//”或者“smj/”打入的编码就找不到“天堂”一词。同样,最简单地办法是击专用键“]”(注意不是“[”!)(目的是转到随意乱打词库),这就找到了“天堂”一词!因为在随意乱打词库中,“天堂”一词的“随意乱打”编码“sflc”或者“smlc”本来就是存在的。由于随意乱打词库的容码空间和主编码库的容码空间一样大,实际上,就等于几乎不增加击键难度的情况下,增加了一倍的容词空间。而如果本文档来自技高网...

【技术保护点】
一种利用键盘技术或类似键盘技术进行语言文字录入或翻译的编码处理方法,其特征是:在进行语言文字录入或者将一种语言翻译成另一种语言时,对所有编码进行分类,形成主编码库和辅编码库,主编码对应的内容直接显示,辅编码对应的内容需用专用键切换或通过类似的功能切换后才能显示。

【技术特征摘要】

【专利技术属性】
技术研发人员:谢春华
申请(专利权)人:谢春华
类型:发明
国别省市:37[中国|山东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1