The input method and device are disclosed. One embodiment of the method comprises: acquiring user input string, and the string processing, get the syllable sequence according to the corresponding relationship between syllables and words; pre established in the lexicon, determine the corresponding entries in the sequence of each syllable syllable; according to the weight transfer between adjacent syllables in the syllable sequence corresponding to 22 entries the adjacent syllable in determining a candidate before entry in a predetermined number of syllables; the last syllable of the corresponding entries selected the syllable sequences as candidate words above the last syllable; according to the weight transfer between the candidate entries each syllable, each syllable from the candidate entries in selected entries generates the syllable sequence the corresponding sentence. The embodiment improves the input efficiency.
【技术实现步骤摘要】
输入方法和装置
本申请涉及计算机
,具体涉及文字输入方法
,尤其涉及输入方法和装置。
技术介绍
现有的输入方法,对于用户输入长句的处理过程如下:为了控制计算量,对用户输入的各个音节根据词频选出候选词,然后,遍历各个音节的候选词,根据各个候选词之间的转移权重,计算各个路径的长句权重。然而,现有的输入方式通常是根据词频选出候选词,经常会造成得不到用户期望的结果。比如,用户输入“xianzhuozi”,期望得到“掀桌子”,但是,对于“xian”这个音节,根据词频选取的话,“掀”作为低频词并未被选作候选词。因此,无论对“xian”的候选词如何与“桌子”的转移权重,均不能得到用户期望的结果。从而,存在着输入效率低的问题。
技术实现思路
本申请的目的在于提出一种改进的输入方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请提供了一种输入方法,上述方法包括:获取用户输入的字符串,并对上述字符串进行处理,得到音节序列;根据预先建立的词库中音节与词条的对应关系,确定上述音节序列中各个音节的对应词条,其中,上述词库包括词条、音节与词条的对应关系、词条之间的转移权 ...
【技术保护点】
一种输入方法,其特征在于,所述方法包括:获取用户输入的字符串,并对所述字符串进行处理,得到音节序列;根据预先建立的词库中音节与词条的对应关系,确定所述音节序列中各个音节的对应词条;根据所述音节序列中相邻音节的对应词条两两之间的转移权重,为相邻音节中的在前音节确定候选词条;选取所述音节序列的最后一个音节的预定数目个对应词条作为所述最后一个音节的候选词条;根据各个音节的候选词条之间的转移权重,从各个音节的候选词条中选取词条生成所述音节序列对应的句子。
【技术特征摘要】
1.一种输入方法,其特征在于,所述方法包括:获取用户输入的字符串,并对所述字符串进行处理,得到音节序列;根据预先建立的词库中音节与词条的对应关系,确定所述音节序列中各个音节的对应词条;根据所述音节序列中相邻音节的对应词条两两之间的转移权重,为相邻音节中的在前音节确定候选词条;选取所述音节序列的最后一个音节的预定数目个对应词条作为所述最后一个音节的候选词条;根据各个音节的候选词条之间的转移权重,从各个音节的候选词条中选取词条生成所述音节序列对应的句子。2.根据权利要求1所述的方法,其特征在于,所述选取所述音节序列的最后一个音节的预定数目个对应词条作为所述最后一个音节的候选词条,包括:从所述最后一个音节的对应词条中,按照词频由大到小的顺序选取预定数目个词条,作为所述最后一个音节的候选词条;或者,根据所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条之间的转移权重,确定所述最后一个音节的候选词条。3.根据权利要求2所述的方法,其特征在于,所述根据所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条之间的转移权重,确定所述最后一个音节的候选词条,包括:遍历最后一个音节的对应词条和最后一个音节的前一音节的对应词条,生成由所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条两两组成的词条对;确定生成的词条对中最后一个音节的对应词条和最后一个音节的前一音节的对应词条之间的转移概率;按照转移概率由大到小的顺序选取预定数目个词条对;将选取出的词条对中所述最后一个音节的对应词条确定为所述最后一个音节的候选词条。4.根据权利要求3所述的方法,其特征在于,所述根据所述音节序列中相邻音节的对应词条两两之间的转移权重,为相邻音节中的在前音节确定候选词条,包括:将所述最后一个音节确定为当前音节;执行确定在前音节的候选词的步骤:根据当前音节的候选词条和所述当前音节的前一音节的对应词条之间的转移概率,确定所述前一音节的候选词条;确定所述前一音节是否是所述音节序列的第一个音节;响应于所述前一音节是所述第一个音节,输出确定的与音节对应的候选词条;响应于所述前一音节不是所述第一个音节,将所述前一音节作为当前音节,继续执行确定在前音节的候选词条的步骤。5.根据权利要求4所述的方法,其特征在于,所述:根据当前音节的候选词条和所述当前音节的前一音节的对应词条之间的转移概率,确定所述前一音节的候选词条,包括:遍历所述当前音节的候选词条和所述当前音节的前一音节的对应词条,生成由所述当前音节的候选词条与所述前一音节的对应词条两两组成的词条对;确定生成的词条对中当前音节的候选词条与前一音节的对应词条之间的转移概率;按照转移概率由大到小的顺序,选取预定数目个词条对;将选取出的词条对中的所述前一音节的对应词条确定为所述前一音节的候选词条。6.根据权利要求1所述的方法,其特征在于,所述根据所述音节序列中相邻音节的对应词条两两之间的转移权重,为相邻音节中的在前音节确定候选词条,包括:将所述音节序列的第一个音节确定为当前音节;执行确定当前音节的候选词条的步骤:根据当前音节的对应词条和所述当前音节的后一音节的对应词条之间的转移概率,确定所述当前音节的候选词条;确定所述后一音节是否是所述音节序列的最后一个音节;响应于所述后一音节是所述最后一个音节,输出确定的与音节对应的候选词条;响应于所述后一音节不是所述最后一个音节,将所述后一音节作为当前音节,继续执行确定在前音节的候选词的步骤。7.根据权利要求6所述的方法,其特征在于,所述根据当前音节的对应词条和所述当前音节的后一音节的对应词条之间的转移概率,确定所述当前音节的候选词条,包括:遍历所述当前音节的对应词条和所述当前音节的后一音节的对应词条,生成由所述当前音节的对应词条和所述后一音节的对应词条两两组成的词条对;确定词条对中所述当前音节的对应词条和所述后一音节的对应词条之间的转移概率;按照转移概率由大到小的顺序选取预定数目个词条对;将选取出的词条对中的所述当前音节的对应词条作为所述当前音节的候选词条。8.根据权利要求7所述的方法,其特征在于,所述从所述音节序列的最后一个音节的对应词条中为所述最后一个音节确定候选词条,包括:响应于所述后一音节是所述最后一个音节,从由所述最后一个音节的对应词条和所述最后一个音节的前一音节的对应词条组成的词条对中,按照转移概率由大到小的顺序选取预定数目个词条对;将选取出的词条对中所述最后一个音节的对应词条作为所述最后一个音节的候选词条。9.根据权利要求1-8中任一项所述的方法,其特征在于,所述根据预先建立的词库中音节与词条的对应关系,确定所述音节序列中各个音节的对应词条,包括:对于所述音节序列...
【专利技术属性】
技术研发人员:陈丽敏,王泰格,陈万顺,陈珠,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。