候选字符串的处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:25636291 阅读:21 留言:0更新日期:2020-09-15 21:29
本申请公开了一种候选字符串的处理方法、装置、电子设备及存储介质,涉及人工智能领域。具体实现方案为:采集用户输入的坐标序列;基于所述坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串。另外,本申请还提供一种候选字符串预测模型的训练方法,包括:采集数条训练数据;各条所述训练数据中包括训练字符串及用户想要输入所述训练字符串时输入的训练坐标序列;采用各条所述训练数据,对所述候选字符串预测模型进行训练。采用本申请训练的候选字符串预测模型,能够有效地提高预测的候选字符串的准确性,进而能够有效地提高输入法的输入准确性和输入效率。

【技术实现步骤摘要】
候选字符串的处理方法、装置、电子设备及存储介质
本申请涉及计算机技术,尤其涉及人工智能,具体涉及一种候选字符串的处理方法、装置、电子设备及存储介质。
技术介绍
移动设备(例如智能手机,平板电脑)在日常生活中扮演着非常重要的角色,越来越多的互联网活动通过移动设备进行。并且在众多的互联网活动中,最为主要的沟通方式便是通过移动设备的输入法进行文字输入。由于移动设备体积的限制,使得移动设备显示屏幕较小,位于屏幕软键盘上的字符区域也较小,因此用户在输入过程中非常容易触到字符区域之外,产生输入错误,用户不得不进行删除以及重新输入。例如,为了提高输入效率,现有的输入法可以根据用户的输入信息,获取与输入信息的拼写相似或者意思相似的词语,作为候选字符串,向用户推荐。但是,按照上述方式获取的候选字符串很难预测到用户的真正意图,预测的候选字符串的准确性较差。
技术实现思路
为了解决上述技术问题,本申请提供了一种用于候选字符串的处理方法、装置、电子设备及存储介质。根据第一方面,提供了一种输入法中的候选字符串的处理方法,其包括:采集用户输入的坐标序列;基于所述坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串。根据第二方面,提供了一种候选字符串预测模型的训练方法,所述方法包括:采集数条训练数据;各条所述训练数据中包括训练字符串及用户想要输入所述训练字符串时输入的训练坐标序列;采用各条所述训练数据,对所述候选字符串预测模型进行训练。根据第三方面,提供了一种输入法中的候选字符串处理装置,包括:采集模块,用于采集用户输入的坐标序列;预测模块,用于基于所述坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串。根据第四方面,提供了一种候选字符串预测模型的训练装置,所述装置包括:采集模块,用于采集数条训练数据;各条所述训练数据中包括训练字符串及用户想要输入所述训练字符串时输入的训练坐标序列;训练模块,用于采用各条所述训练数据,对所述候选字符串预测模型进行训练。根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方法。根据本申请的技术解决了现有的候选字符串预测准确性差的的问题,通过采集用户输入的坐标序列;基于坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串。由于该预先训练的候选字符串预测模型为端到端的模型,该候选字符串预测模型在预测候选字符串时不会累计误差,能够有效地提高预测的准确性。因此,本申请的技术方案,基于坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串,能够有效地提高预测的候选字符串的准确性,进而能够有效地提高输入法的输入准确性和输入效率。同时,本申请实施例的技术方案,也能够有效地增强用户使用输入法的体验度,进而增强用户对输入法的粘性。进一步地,本申请,通过采集数条训练数据;各条训练数据中包括训练字符串及用户想要输入训练字符串时输入的训练坐标序列;采用各条训练数据,对候选字符串预测模型进行训练,可以使得训练的候选字符串预测模型为一个端到端的预测模型,在输入坐标序列时,可以直接预测对应的候选字符串;而且能够有效地保证预测的候选字符串的准确性,进而能够有效地提高输入法的输入准确性和输入效率。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的示意图;图2是根据本申请第二实施例的示意图;图3是根据本申请第三实施例的示意图;图4是根据本申请第四实施例的示意图;图5是根据本申请第五实施例的示意图;图6是根据本申请第六实施例的示意图;图7是根据本申请第七实施例的示意图;图8是根据本申请第八实施例的示意图;图9是根据本申请第九实施例的示意图;图10是用来实现本申请实施例的上述方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本申请第一实施例的示意图;如图1所示,本实施例提供一种输入法中的候选字符串的处理方法,具体可以包括如下步骤:S101、采集用户输入的坐标序列;S102、基于坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串。本实施例的输入法中的候选字符串的处理方法的执行主体为输入法中的候选字符串处理装置,该装置可以设置在输入法中,为输入法筛选候选字符串即候选字符串。具体地,用户在使用输入法输入字符串时,通常可以打开输入法的软键盘,根据软键盘中标识的字符,点击相应位置,用于实现该位置字符的输入。即在用户一侧,用户点击的是位置。而在输入法一侧,通过建立坐标系,检测软键盘中被点击的坐标位置对应哪个字符,从而确定用户该次点击想要输入哪个字符。基于此原理,输入法中的候选字符串处理装置可以采集到用户在输入字符串时,输入的每个字符的坐标,进而可以采集到用户输入的包括先后输入的多个坐标的坐标序列。即该坐标序列中各坐标可以按照被用户输入时点击的先后顺序排列。本实施例中,用户想要输入的字符串中可以包括两个或者两个以上的多个字符。对应地,该坐标序列中可以包括两个或者多个坐标。本实施例的坐标为二维坐标。本实施例中,预先训练的候选字符串预测模型可以为一个端到端的模型,使用时,直接将坐标序列输入至该候选字符串预测模型中,该候选字符串预测模型可以基于该坐标序列,预测至少一个候选字符串。由于用户想要输入字符串时,可能会存在点击字符的位置错误,用户对想要输入字符串拼写错误以及输入时字符顺序错误等等,所以,本实施例的候选字符串预测模型可以基于用户输入的坐标序列,预测一个、两个或者多个候选字符串,以供用户从中选择想要输入的字符串。而由上述实施例可知,本实施例的候选字符串预测模型为预先经过深度学习的端到端的候选字符串预测模型,属于一种深度学习模型。该端到端的候选字符串预测模型在训练时为一个整体,其包括的所有模块一起训练的。在使用时,该候选字符串预测模型中的某个模块不会单独输出结果,整个候选字符串预测模型根据输入只输出一个最终的结果,即一个本文档来自技高网...

【技术保护点】
1.一种输入法中的候选字符串的处理方法,其特征在于,包括:/n采集用户输入的坐标序列;/n基于所述坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串。/n

【技术特征摘要】
1.一种输入法中的候选字符串的处理方法,其特征在于,包括:
采集用户输入的坐标序列;
基于所述坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串。


2.根据权利要求1所述的方法,其特征在于,基于所述坐标序列以及预先训练的候选字符串预测模型,预测至少一个候选字符串,包括:
采用所述候选字符串预测模型中的编码器,基于所述坐标序列进行编码处理,获取到所述坐标序列的特征表达;
采用所述候选字符串预测模型中的解码器,基于所述坐标序列的特征表达进行解码,获取所述至少一个候选字符串。


3.根据权利要求2所述的方法,其特征在于,采用所述候选字符串预测模型中的编码器,基于所述坐标序列进行编码处理,获取到所述坐标序列的特征表达,包括:
采用所述编码器,对所述坐标序列中的各坐标进行映射表达,得到各所述坐标的特征表达;
采用所述编码器,基于各所述坐标的特征表达进行编码处理,获取到所述坐标序列的特征表达。


4.根据权利要求3所述的方法,其特征在于,采用所述编码器,对所述坐标序列中的各坐标进行映射表达,得到各所述坐标的特征表达之前,所述方法还包括:
对所述坐标序列中各坐标进行归一化处理,得到归一化后的所述坐标序列。


5.根据权利要求2所述的方法,其特征在于,采用所述候选字符串预测模型中的解码器,基于所述坐标序列的特征表达进行解码,获取所述至少一个候选字符串,包括:
采用所述解码器,以所述坐标序列的特征表达作为初始的隐含层状态进行解码,获取候选字符集合中各字符成为解码字符的解码概率;
从所述候选字符集合中搜索解码概率最大的N个字符;
对所述N个字符中各所述字符进行特征映射,得到相应的特征表达;
对于所述N个字符中各所述字符,采用所述字符的特征表达,更新隐含层状态;并基于更新后的所述隐含层状态,继续解码,再次获取所述候选字符集合中各所述字符成为解码字符的解码概率,并获取解码概率最大的N个字符,以此类推,直至解码到结束符或者解码得到的字符串长度达预设阈值,解码结束,获取得到所述至少一个候选字符串。


6.根据权利要求1-5任一所述的方法,其特征在于,所述方法还包括:
基于所述坐标序列以及所述候选字符串预测模型,预测各所述候选字符串的概率;
按照概率由大到小的顺序,向所述用户推荐所述至少一个候选字符串。


7.一种候选字符串预测模型的训练方法,其特征在于,所述方法包括:
采集数条训练数据;各条所述训练数据中包括训练字符串及用户想要输入所述训练字符串时输入的训练坐标序列;
采用各条所述训练数据,对所述候选字符串预测模型进行训练。


8.根据权利要求7所述的方法,其特征在于,采用各条所述训练数据,对所述候选字符串预测模型进行训练,包括:
对于各条所述训练数据,基于所述训练数据中的所述训练坐标序列以及所述候选字符串预测模型,生成预测字符串的各预测字符的预测概率分布;
检测所述预测字符串的各预测字符的预测概率分布与所述训练字符串对应字符的已知概率分布是否一致;
若不一致,调整所述候选字符串预测模型的参数,使得各所述预测字符的预测概率分布趋于所述已知概率分布。


9.根据权利要求8所述的方法,其特征在于,对于各条所述训练数据,基于所述训练数据中的所述训练坐标序列以及所述候选字符串预测模型,生成预测字符串的各预测字符的预测概率分布,包括:
对于各条所述训练数据,采用所述候选字符串预测模型中的编码器,基于所述训练坐标序列进行编码处理,获取到所述训练坐标序列的特征表达;
采用所述候选字符串预测模型中的解码器,基于所述训练坐标序列的特征表达进行解码,获取所述预测字符串的各预测字符的预测概率分布。


10.根据权利要求9所述的方法,其特征在于,采用所述候选字符串预测模型中的解码器,基于所述训练坐标序列的特征表达进行解码,获取所述预测字符串的各预测字符的预测概率分布,包括:
若解码所述预测字符串中第一个字符时,采用所述解码器,以所述训练坐标序列的特征表达作为初始的隐含层状态进行解码,获取候选字符集合中各字符成为解码字符的解码概率;并基于所述候选字符集合中各字符的解码概率,生成所述预测字符串中第一个字符的预测概率分布;
若解码所述预测字符串中第一个字符之外的其他字符时,采用所述编码器,对所述解码得到前一个字符进行特征映射,得到相应的特征表达;采用所述解码器基于所述前一个字符的特征表达,更新隐含层状态;并基于更新后的所述隐含层状态,继续解码,获取所述预测字符串中的所述其他字符的预测概率分布。


11.一种输入法中的候选字符串处理装置,其特征在于...

【专利技术属性】
技术研发人员:王鑫李旭孙明明李平
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1