输入法词库更新方法、装置、设备及服务器制造方法及图纸

技术编号:36732800 阅读:12 留言:0更新日期:2023-03-04 10:01
本申请公开了一种输入法词库更新方法、装置、设备及服务器,属于输入法领域。该输入法词库更新方法包括:基于在输入法界面输入的第一字符串显示N个候选词;接收对该N个候选词中的目标候选词的第一输入;响应于该第一输入,在该第一字符串包括的音节数大于或等于预设值的情况下,向服务器发送该目标候选词和第一候选词,该第一候选词为该N个候选词中排序在首位的候选词;在接收到服务器发送的目标输入法词库的情况下,将原始输入法词库更新为该目标输入法词库,其中,该目标输入法词库为根据用户选择的候选词和排序在首位的候选词确定的。户选择的候选词和排序在首位的候选词确定的。户选择的候选词和排序在首位的候选词确定的。

【技术实现步骤摘要】
输入法词库更新方法、装置、设备及服务器


[0001]本申请属于输入法领域,具体涉及一种输入法词库更新方法、装置、设备及服务器。

技术介绍

[0002]随着终端设备的普及,终端设备中的社交应用程序、购物应用程序和支付应用程序等均依赖于输入法的支持。
[0003]目前,一个长拼音串对应的出词列表中可能包含了多个候选词组,而这些候选词组的出词顺序通常是由预先训练好的语言模型决定的。具体地,服务器会根据语言模型中的词元丰富程度、词元分布和实际应用场景,对多个候选词组打分,并将打分高的候选词组排序在前,将打分低的候选词组排序在后。
[0004]但是,某些情况下候选词组的出词顺序可能并不符合用户实际使用需求,导致输入法的长句出词的效果较差。

技术实现思路

[0005]本申请实施例的目的是提供一种输入法词库更新方法、装置、设备及服务器,能够解决输入法的长句出词的效果较差的问题。
[0006]第一方面,本申请实施例提供了一种输入法词库更新方法,应用于电子设备。该方法包括:基于在输入法界面输入的第一字符串显示N个候选词;接收对该N个候选词中的目标候选词的第一输入;响应于该第一输入,在该第一字符串包括的音节数大于或等于预设值的情况下,向服务器发送该目标候选词和第一候选词,该第一候选词为该N个候选词中排序在首位的候选词;在接收到服务器发送的目标输入法词库的情况下,将原始输入法词库更新为该目标输入法词库,其中,该目标输入法词库为根据用户选择的候选词和排序在首位的候选词确定的。
[0007]第二方面,本申请实施例提供了一种输入法词库更新方法,应用于服务器。该方法包括:接收由电子设备发送的目标候选词和第一候选词,其中,该第一候选词为在N个候选词中排序在首位的候选词,该目标候选词为用户在N个候选词中选择的候选词,该N个候选词为基于第一字符串确定的,该第一字符串包括的音节数大于或等于预设值;在该目标候选词不为该第一候选词的情况下,将该第一候选词添加至第一列表,并将该目标候选词添加至第二列表,其中,该第一列表包括未被用户选择的至少一个排序在首位的候选词,该第二列表包括被用户选择的至少一个排序在非首位的候选词;在该目标候选词不为该第一候选词的概率大于或等于预设概率的情况下,根据该第一列表和/或第二列表,确定目标输入法词库;向电子设备发送该目标输入法词库。
[0008]第三方面,本申请实施例提供了一种输入法词库更新装置。该装置包括显示模块、接收模块、通信模块和处理模块。显示模块,用于基于在输入法界面输入的第一字符串显示N个候选词。接收模块,用于接收对显示模块显示的该N个候选词中的目标候选词的第一输
入。通信模块,用于响应于接收模块接收的该第一输入,在该第一字符串包括的音节数大于或等于预设值的情况下,向服务器发送该目标候选词和第一候选词,该第一候选词为该N个候选词中排序在首位的候选词。处理模块,用于在通信模块接收到服务器发送的目标输入法词库的情况下,将原始输入法词库更新为该目标输入法词库,其中,该目标输入法词库为根据用户选择的候选词和排序在首位的候选词确定的。
[0009]第四方面,本申请实施例提供了一种输入法词库更新装置。该装置包括通信模块和处理模块。通信模块,用于接收由电子设备发送的目标候选词和第一候选词,其中,该第一候选词为在N个候选词中排序在首位的候选词,该目标候选词为用户在N个候选词中选择的候选词,该N个候选词为基于第一字符串确定的,该第一字符串包括的音节数大于或等于预设值。处理模块,用于在通信模块接收的该目标候选词不为该第一候选词的情况下,将该第一候选词添加至第一列表,并将该目标候选词添加至第二列表,其中,该第一列表包括未被用户选择的至少一个排序在首位的候选词,该第二列表包括被用户选择的至少一个排序在非首位的候选词。处理模块,还用于在该目标候选词不为该第一候选词的概率大于或等于预设概率的情况下,根据该第一列表和/或第二列表,确定目标输入法词库。通信模块,还用于向电子设备发送该目标输入法词库。
[0010]第五方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的程序或指令,该程序或指令被该处理器执行时实现如第一方面提供的方法的步骤。
[0011]第六方面,本申请实施例提供了一种服务器,该服务器包括处理器、存储器及存储在该存储器上并可在该处理器上运行的程序或指令,该程序或指令被该处理器执行时实现如第二方面提供的方法的步骤。
[0012]第七方面,本申请实施例提供了一种可读存储介质,该可读存储介质上存储程序或指令,该程序或指令被处理器执行时实现如第一方面或第二方面提供的方法的步骤。
[0013]第八方面,本申请实施例提供了一种芯片,该芯片包括处理器和通信接口,该通信接口和该处理器耦合,该处理器用于运行程序或指令,实现如第一方面或第二方面提供的方法。
[0014]在本申请实施例中,用户在输入法界面输入长音节串之后,电子设备可以响应于对N个候选词中的目标候选词的选择输入,向服务器发送该目标候选词和该N个候选词中排序在首位的第一候选词。之后,若该目标候选词不是该第一候选词,则服务器可以将第一候选词和目标候选词分别添加至第一列表和第二列表,并在目标候选词不为第一候选词的概率大于或等于预设概率的情况下,根据该第一列表和/或第二列表,确定目标输入法词库,以及向电子设备发送该目标输入法词库。然后,电子设备可以将原始输入法词库更新为该目标输入法词库。如此,实现了基于用户实际输入情况更新输入法词库,使得长字符串对应的候选词组的出词顺序更符合用户实际使用需求,并提高了输入法的长句出词的效果。
附图说明
[0015]图1是本申请实施例可应用的一种无线通信系统的框图;
[0016]图2是本申请实施例提供的输入法词库更新方法的流程图;
[0017]图3是本申请实施例提供的输入法词库更新装置的结构示意图之一;
[0018]图4是本申请实施例提供的输入法词库更新装置的结构示意图之二;
[0019]图5是本申请实施例提供的一种通信设备的示意图;
[0020]图6是本申请实施例提供的一种电子设备的硬件结构示意图;
[0021]图7是本申请实施例提供的一种服务器的硬件结构示意图。
具体实施方式
[0022]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
[0023]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种输入法词库更新方法,应用于电子设备,其特征在于,所述方法包括:基于在输入法界面输入的第一字符串显示N个候选词;接收对所述N个候选词中的目标候选词的第一输入;响应于所述第一输入,在所述第一字符串包括的音节数大于或等于预设值的情况下,向服务器发送所述目标候选词和第一候选词,所述第一候选词为所述N个候选词中排序在首位的候选词;在接收到所述服务器发送的目标输入法词库的情况下,将原始输入法词库更新为所述目标输入法词库,其中,所述目标输入法词库为根据用户选择的候选词和排序在首位的候选词确定的。2.一种输入法词库更新方法,应用于服务器,其特征在于,所述方法包括:接收由电子设备发送的目标候选词和第一候选词,其中,所述第一候选词为在N个候选词中排序在首位的候选词,所述目标候选词为用户在所述N个候选词中选择的候选词,所述N个候选词为基于第一字符串确定的,所述第一字符串包括的音节数大于或等于预设值;在所述目标候选词不为所述第一候选词的情况下,将所述第一候选词添加至第一列表,并将所述目标候选词添加至第二列表,其中,所述第一列表包括未被用户选择的至少一个排序在首位的候选词,所述第二列表包括被用户选择的至少一个排序在非首位的候选词;在所述目标候选词不为所述第一候选词的概率大于或等于预设概率的情况下,根据所述第一列表和/或第二列表,确定目标输入法词库;向所述电子设备发送所述目标输入法词库。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一列表和/或第二列表,确定目标输入法词库,包括:将预训练语言词库中的第一类候选词和第二类候选词删除,得到所述目标输入法词库;其中,所述第一类候选词为包含在所述第一列表中的相对熵小于或等于第一阈值的候选词;所述第二类候选词为包含在所述第二列表中的相对熵小于或等于第二阈值的候选词;所述第一阈值大于所述第二阈值。4.根据权利要求2所述的方法,其特征在于,所述根据所述第一列表和/或第二列表,确定目标输入法词库,包括:为所述第二列表中的候选词添加预设标签;对添加过所述预设标签的候选词做数据增强处理,生成至少一个语料;将所述至少一个语料添加至预训练语言词库;对添加语料的预训练语言词库剪枝,得到所述目标输入法词库。5.根据权利要求2至4中任一项所述的方法,其特征在于,所述将所述第一候选词添加至第一列表,并将所述目标候选词添加至第二列表,包括:切分所述第一候选词,得到P个词元组,所述P个词元组中的每个词元组包括至少两个词元;切分所述目标候选词,得到T个词元组,所述T个词元组中的每个词元组包括至少两个词元;
将所述P个词元组中的符合预设条件的词元组添加至所述第一列表;将所述T个词元组中的符合预设条件的词元组添加至所述第二列表;其中,所述预设条件为:词元组包括的所有词元为输入法词库中的词元,所述P、T为正整数。6.一种输入法词库更新装置,其特征在于,所述装置包括显示模块、接收模块、通信模块和处理模块;所述显示模块,用于基于在输入法界面输入的第一字符串显示N个候选词;所述接收模块,用于接收对所述显示模块显示的所述N个候选词中的目标候选词的第一输入;所述通信模块,用于响应于所述接收模块接收的所述第一输入,在所述第一字符串包括的音节数大于或等于...

【专利技术属性】
技术研发人员:金红豆
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1