一种输入方法、装置和用于输入的装置制造方法及图纸

技术编号:16700296 阅读:27 留言:0更新日期:2017-12-02 12:30
本发明专利技术实施例提供了一种输入方法、装置和用于输入的装置,其中的输入方法具体包括:获取输入串对应的第一向量序列;依据预置的多元关系计算规则,计算得到所述第一向量序列对应的第一多元关系得分;依据所述第一多元关系得分,确定所述输入串对应的候选项。本发明专利技术实施例可以存储用于获得上述第一向量序列的向量,而可以不存储大于等于2的所有的多元关系,因此可以节省大量的存储空间。

An input method, device, and device for input

The embodiment of the invention and a device is provided for input method, input device, input method which includes: obtaining the first vector sequence corresponding to the input string; according to the multiple relationship preset calculation rules, calculated the first vector sequence corresponding to the first multivariate relationship score; according to the first multivariate relationship score. Determine the input string corresponding to the candidate. The embodiment of the invention can store vectors for obtaining the first vector sequence, and can not store all the multivariate relations greater than or equal to 2, so that a large amount of storage space can be saved.

【技术实现步骤摘要】
一种输入方法、装置和用于输入的装置
本专利技术涉及输入法
,特别是涉及一种输入方法、装置和用于输入的装置。
技术介绍
对于中文、日文、韩文等用户而言,一般都需要通过输入法系统与计算机进行交互。例如,用户可以通过键盘键入输入串,然后由输入法系统依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。随着输入法技术的不断发展,以及对输入体验的不断提升,用户对于输入长词或者句子的需求也在增加,例如输入长词:“海边抓螃蟹”、“公积金天天降”、“美利坚合众国德州”、“今天天气真是阳光明媚”等。为了满足用户对于上述长词或者句子的输入需求,按照传统的n-gram(n元关系)存储方式,系统词库中需要存储“海边|抓|螃蟹”这样的三元组或者多元组。然而,在实际应用中,当n元关系大于等于3时,所需要存储的多元关系将以几何的倍数增长,对于内存有限的输入设备,如手机、平板电脑等显然不能满足对n-gram存储结构的完整存储,因此,系统词库通常采用n-gram中的2元关系。可以看出,现有的n-gram存储方式在存储空间有限的情况下,无法满足对多元关系的需求。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的输入方法、装置和用于输入的装置,能够简化数学表达式的输入过程,提高输入效率。为了解决上述问题,本专利技术实施例公开了一种输入方法,包括:获取输入串对应的第一向量序列;依据预置的多元关系计算规则,计算得到所述第一向量序列对应的第一多元关系得分;依据所述第一多元关系得分,确定所述输入串对应的候选项。可选地,所述获取输入串对应的第一向量序列的步骤,包括:依据元词对用户的输入串进行切分,以得到第一字符切分结果;获取所述第一字符切分结果对应的第一元词序列;查询已建立的词向量库,获取所述第一元词序列中各元词对应的向量;对所述第一元词序列中各元词对应的向量依次串接,得到所述输入串对应的第一向量序列。可选地,通过如下步骤建立所述词向量库:获取词库中元词对应的元词号;对所述词库中的元词生成对应的向量;依据所述元词号与所述向量之间的映射关系,建立词向量库。可选地,所述方法还包括:获取所述输入串对应的系统词序列;确定所述系统词序列对应的第二多元关系得分;则所述依据所述第一多元关系得分,确定所述输入串对应的候选项的步骤,包括:依据所述第一多元关系得分以及第二多元关系得分的排序,确定所述输入串对应的候选项。可选地,所述获取所述输入串对应的系统词序列的步骤,包括:依据系统词对所述输入串进行切分,以得到第二字符切分结果;获取所述第二字符切分结果对应的系统词序列。可选地,所述确定所述系统词序列对应的第二多元关系得分的步骤,包括:在系统词库中查询得到所述系统词序列中各系统词对应的词频,计算得到所述系统词序列对应的一元组词得分;在所述系统词序列中存在二元关系时,依据所述二元关系,计算得到所述系统词序列对应的二元组词得分;依据所述一元组词得分以及二元组词得分,确定所述系统词序列对应的第二多元关系得分。可选地,所述方法还包括:获取所述输入串的上文和/或下文对应的第二元词序列;查询已建立的词向量库,获取所述第二元词序列中各元词对应的向量;对所述第二元词序列中各元词对应的向量依次串接,得到第二向量序列;计算所述第一向量序列与第二向量序列之间的第三多元关系得分,依据所述第三多元关系得分对所述输入串对应的候选项的排序进行调整。可选地,所述方法还包括:依据所述输入串的上文和/或下文,获取所述输入对应的联想候选项;获取所述联想候选项对应的第三向量序列;计算所述第二向量序列与第三向量序列之间的第四多元关系得分,依据所述第四多元关系得分对所述联想候选项进行排序展示。另一方面,本专利技术实施例公开了一种输入装置,包括:第一向量序列获取模块,用于获取输入串对应的第一向量序列;第一多元关系计算模块,用于依据预置的多元关系计算规则,计算得到所述第一向量序列对应的第一多元关系得分;以及候选项确定模块,用于依据所述第一多元关系得分,确定所述输入串对应的候选项。又一方面,本专利技术实施例公开了一种用于输入的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取输入串对应的第一向量序列;依据预置的多元关系计算规则,计算得到所述第一向量序列对应的第一多元关系得分;依据所述第一多元关系得分,确定所述输入串对应的候选项。本专利技术实施例包括以下优点:在本专利技术实施例中,可以按照预置的多元关系计算规则,对输入串对应的第一向量序列进行计算,从而得到所述第一向量序列对应的多元关系得分,并且依据所述多元关系得分,确定所述输入串对应的候选项,使得获取的候选项可以体现输入串中的多元关系。由于本专利技术实施例的多元关系得分是通过对第一向量序列计算得到的,而不是从词库中获取的,也即,本专利技术实施例仅需存储用于获得上述第一向量序列的向量,而可以不存储大于等于2的所有的多元关系,因此可以节省大量的存储空间。附图说明图1是本专利技术的一种输入方法实施例一的步骤流程图;图2是本专利技术的一种生成词向量库的方法实施例的步骤流程图;图3是本专利技术的一种输入方法实施例三的步骤流程图;图4是本专利技术的一种输入方法实施例四的步骤流程图;图5是本专利技术的一种输入方法实施例五的步骤流程图;图6是本专利技术的一种输入装置实施例的结构框图;图7是本专利技术的一种用于输入的装置800的框图;及图8是本专利技术的一种服务器的结构示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。本专利技术实施例的核心构思之一在于,提出一种在使用输入法输入过程中,通过预置的多元关系计算规则,计算得到多元关系得分的方案,并且可以依据所述多元关系得分,确定输入串对应的候选项,使得获取的候选项可以体现输入串中的多元关系。在该方案中,由于本专利技术实施例的多元关系得分是通过对第一向量序列计算得到的,而不是从词库中获取的,也即,本专利技术实施例可以仅需存储用于获得上述第一向量序列的向量,而可以不存储大于等于2的所有的多元关系,因此可以节省大量的存储空间。方法实施例一参照图1,示出了本专利技术的一种输入方法实施例一的步骤流程图,具体可以包括如下步骤:步骤101、获取输入串对应的第一向量序列;步骤102、依据预置的多元关系计算规则,计算得到所述第一向量序列对应的第一多元关系得分;步骤103、依据所述第一多元关系得分,确定所述输入串对应的候选项。本专利技术实施例可以应用于各种输入方式的输入法系统,例如,拼音输入、英文输入、笔画输入、语音输入和手写输入等。用户可以通过上述任意输入方式完成输入串的输入,也即,用户可以通过实体键盘、虚拟键盘、手写板、触摸屏、声音采集装置等进行输入。其中,输入串可以是由数字、符号、拼音、英文字母等中任一项或几项组成的。为了便于描述,本专利技术实施例均以拼音串作为输入串进行说明,其它类型的输入串相互参照即可。在使用输入法进行输入的过程中,为了能够获取更多的n元关系(n大于等于2),需要耗费相当大的存储空间来存储n-gram结构,然而,对于存本文档来自技高网...
一种输入方法、装置和用于输入的装置

【技术保护点】
一种输入方法,其特征在于,包括:获取输入串对应的第一向量序列;依据预置的多元关系计算规则,计算得到所述第一向量序列对应的第一多元关系得分;依据所述第一多元关系得分,确定所述输入串对应的候选项。

【技术特征摘要】
1.一种输入方法,其特征在于,包括:获取输入串对应的第一向量序列;依据预置的多元关系计算规则,计算得到所述第一向量序列对应的第一多元关系得分;依据所述第一多元关系得分,确定所述输入串对应的候选项。2.根据权利要求1所述的方法,其特征在于,所述获取输入串对应的第一向量序列的步骤,包括:依据元词对用户的输入串进行切分,以得到第一字符切分结果;获取所述第一字符切分结果对应的第一元词序列;查询已建立的词向量库,获取所述第一元词序列中各元词对应的向量;对所述第一元词序列中各元词对应的向量依次串接,得到所述输入串对应的第一向量序列。3.根据权利要求2所述的方法,其特征在于,通过如下步骤建立所述词向量库:获取词库中元词对应的元词号;对所述词库中的元词生成对应的向量;依据所述元词号与所述向量之间的映射关系,建立词向量库。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述输入串对应的系统词序列;确定所述系统词序列对应的第二多元关系得分;则所述依据所述第一多元关系得分,确定所述输入串对应的候选项的步骤,包括:依据所述第一多元关系得分以及第二多元关系得分的排序,确定所述输入串对应的候选项。5.根据权利要求4所述的方法,其特征在于,所述获取所述输入串对应的系统词序列的步骤,包括:依据系统词对所述输入串进行切分,以得到第二字符切分结果;获取所述第二字符切分结果对应的系统词序列。6.根据权利要求5所述的方法,其特征在于,所述确定所述系统词序列对应的第二多元关系得分的步骤,包括:在系统词库中查询得到所述系统词序列中各系统词对应的词频,计算得到所述系统词序列对应的一元组词得分;在所述系统词序列中存在二元关...

【专利技术属性】
技术研发人员:崔欣张扬
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1