一种至少两种语言混合输入的方法和输入法系统技术方案

技术编号:3919249 阅读:297 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种至少两种语言混合输入的方法和一种输入法系统,其中所述方法包括:接收用户输入的编码字符串;依据所接收的编码字符串,解析得到至少两种类型的匹配序列的混合序列;依据解析得到的混合序列,检索得到匹配的候选项;依据所述候选项,输出相应的上屏内容;所述上屏内容为至少两种语言的混合。本发明专利技术能够对用户输入的混合多个语言的片段(例如,中文片段和英文片段)进行混合解析转换,得到混合候选项,实现混合输入,并具有较高的输入效率。

【技术实现步骤摘要】

本专利技术涉及输入法
,特别是涉及一种至少两种语言混合输入的方法和一 种输入法系统。
技术介绍
随着国际化交流合作的增进,中国人在使用中文的同时,越来越多的用到英文。另 外汉语中也出现越来越多的英文成分,例如“⑶”、“V⑶”、“DVD”等。又如软件开发人员常使 用“bug”一词来指代软件系统中的缺陷,由于该词汇已经如此深入人心,以至于中文“缺陷” 一词反而较少使用。在输入中文过程中,同时涉及英文的输入(并且没有标点等明显的界 限),就称为“中英文混输”。例如,“⑶”和“机”的连续输入,“改”和“bug”的连续输入等。 由于英文的处理方式和中文完全不同,因此需要对现有的中文输入法进行特殊处理。现有技术中的常用方案是用户在输入中文时,打开某个输入法,如果希望输入英 文,只要将输入法关闭即可。例如,Ctrl+空格键关闭/启用输入法。在某些系统中,关闭 输入法实际上是切换到一类称为“键盘”的特殊输入法,其不对字符进行任何转换,直接让 按键对应的英文字母上屏。为了减少关闭/启用输入法所导致的系统开销,很多输入法提供了独立的英文模 式,例如用Shift键在中文/英文模式之间进行切换。在英文模式下,输入法会将按键对应 的字母直接上屏。效果上,跟关闭输入法是等效的。进一步,还有一些输入法设置了临时英文模式。例如,用字母ν引导一段英文。由 于在标准拼音中不存在以字母ν开头的音节,因此输入法能够进行识别。用户确认输入后, 字母ν后面的部分将上屏。参照图1,用户输入“vbug”表示要输入英文“bug”,前面的字母 V用来进行模式区分,因此在实际显示时为“〉”以表示该字符并不会上屏。或者,还有一些输入法虽然给出了中文候选项,参照图2,但是允许用户通过 Enter键输入英文“bug”。上述现有技术的一个共同特点就是被动识别,其主要的缺陷在于用户需要在上 屏候选项之前明确要输入的是中文还是英文,在中文和英文混合输入时,必须通过不同的 按键频繁切换输入模式。不仅操作复杂,而且极易误操作。总之,需要本领域技术人员迫切解决的一个技术问题就是如何能够改善用户在 中英文混合输入,甚至多语言混合输入情况下的输入效率。
技术实现思路
本专利技术所要解决的技术问题是提供一种至少两种语言混合输入的方法和一种输 入法系统,以对用户输入的混合多个语言的片段(例如,中文片段和英文片段)进行混合解 析转换,得到混合候选项,并具有较高的输入效率。为了解决上述问题,本专利技术公开了一种至少两种语言混合输入的方法,包括接收 用户输入的编码字符串;依据所接收的编码字符串,解析得到至少两种类型的匹配序列的混合序列;依据解析得到的混合序列,检索得到匹配的候选项;依据所述候选项,输出相应 的上屏内容;所述上屏内容为至少两种语言的混合。优选的,从包括混合序列到至少两种语言的混合字词的映射关系中检索得到相匹 配的候选项。优选的,依据所述混合序列中的部分序列检索得到所匹配的候选项;依据用户对 各部分序列所匹配候选项的选择,输出相应的上屏内容。优选的,依据所述混合序列中的部分序列检索得到所匹配的候选项;将其中符合 预置条件的候选项直接上屏输出;依据用户对其他各部分序列所匹配候选项的选择,输出 相应的上屏内容。优选的,所述方法还可以包括保存所述混合序列与所输出的上屏内容的映射关系。优选的,至少两种类型的匹配序列包括音节序列、仿音节序列、数字序列、符号序 列中的至少两种;或者,至少两种类型的匹配序列包括形码序列、仿形码序列、数字序列、符 号序列中的至少两种。优选的,形码序列包括中文五笔输入法输入序列、韩文输入法输入序列;仿形码 序列是以输入的字母本身作为上屏输出的文字组成,并具有与形码序列相同映射规则的序 列。优选的,音节序列包括中文拼音输入法输入序列、日文输入法输入序列;仿音节 序列是以输入的字母本身作为上屏输出的文字组成,并具有与音节序列相同映射规则的序 列。优选的,通过以下步骤针对编码字符串进行解析将所接收的编码字符串中符合 预置规则的字符串解析为第一类型的匹配序列,其他字符串解析为其他类型的匹配序列。优选的,通过以下步骤针对编码字符串进行解析将小写字母识别为第一类型匹 配序列,小写字母以外的大写字母、数字、符号作为其他类型的匹配序列;或者,将输入的编 码字符串按照第一语言切分,若切分结果的文字命中率高于阈值,则将其解析为第一类型 匹配序列;其他字符串解析为其他类型的匹配序列。优选的,形码序列对应需要笔画转换的语言文字;音节序列对应需要音节转换的 语言文字;仿音节序列或仿形码序列对应键盘字符与上屏字符有直接对应关系的语言文 字;数字序列对应数字语言字符;符号序列对应符号语言字符。优选的,当所述仿音节序列对应的为英文语言时,所述仿音节包括英文字母,一个 英文字母对应一个仿音节;或者,所述仿音节包括大写英文字母、小写英文字母和特殊符 号,其中,一个大写英文字母、一个小写英文字母或者一个特殊符号对应一个仿音节。优选的,当所述解析得到的混合序列为多个时,则针对各个混合序列,分别检索得 到多个相应的候选项。依据本专利技术的另一实施例,还公开了一种输入法系统,包括输入接口单元,用于接收用户输入的编码字符串;字符串解析单元,用于依据所接收的编码字符串,解析得到至少两种类型的匹配 序列的混合序列;候选项转换单元,用于依据解析得到的混合序列,检索得到匹配的候选项;输出单元,用于依据所述候选项,输出相应的上屏内容;所述上屏内容为至少两种 语言的混合。优选的,候选项转换单元具体从包括混合序列到至少两种语言的混合字词的映射 关系中检索得到相匹配的候选项。优选的,候选项转换单元具体依据所述混合序列中的部分序列检索得到所匹配的 候选项;输出单元具体依据用户对各部分序列所匹配候选项的选择,输出相应的上屏内容。优选的,候选项转换单元具体依据所述混合序列中的部分序列检索得到所匹配的 候选项;输出单元将其中符合预置条件的候选项直接上屏输出;并依据用户对其他各部分 序列所匹配候选项的选择,输出相应的上屏内容。优选的,所述输入法系统还可以包括混合造词单元,用于保存所述混合序列与所 输出的上屏内容的映射关系。优选的,至少两种类型的匹配序列包括音节序列、仿音节序列、数字序列、符号序 列中的至少两种;或者,至少两种类型的匹配序列包括形码序列、仿形码序列、数字序列、符 号序列中的至少两种。优选的,形码序列包括中文五笔输入法输入序列、韩文输入法输入序列;仿形码 序列是以输入的字母本身作为上屏输出的文字组成,并具有与形码序列相同映射规则的序 列。优选的,音节序列包括中文拼音输入法输入序列、日文输入法输入序列;仿音节 序列是以输入的字母本身作为上屏输出的文字组成,并具有与音节序列相同映射规则的序 列。优选的,所述输入法系统还可以包括用于存储预置规则的规则单元;所述字符 串解析单元,将所接收的编码字符串中符合预置规则的字符串解析为第一类型的匹配序 列,其他字符串解析为其他类型的匹配序列。优选的,所述符合预置规则的字符串是指形式为小写字母的字符串;或者,所述预 置规则为判断将输入的编码字符串按照第一语言切分后的切分结果的文字命中率是否高 于阈值,如果是,则符号预置规则。优选的,形码序列对应需要笔画转换的语言文字;音节序列对应需要本文档来自技高网
...

【技术保护点】
一种至少两种语言混合输入的方法,其特征在于,包括:接收用户输入的编码字符串;依据所接收的编码字符串,解析得到至少两种类型的匹配序列的混合序列;依据解析得到的混合序列,检索得到匹配的候选项;依据所述候选项,输出相应的上屏内容;所述上屏内容为至少两种语言的混合。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨磊郭新涛何立涛郭小军
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1