System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 词汇挖掘方法、装置、电子设备及存储介质制造方法及图纸_技高网

词汇挖掘方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40301043 阅读:5 留言:0更新日期:2024-02-07 20:48
本发明专利技术提供一种词汇挖掘方法、装置、电子设备及存储介质;方法包括:获取用户输入的第一拼音串,第一拼音串包括至少一个拼音组;接收所述用户输入的目标指令,响应于目标指令,基于第一拼音串,从各拼音组对应的至少一个词汇中确定各拼音组对应的第一词汇;基于各拼音组对应的第一词汇,确定第一拼音串对应的目标代价词;目标代价词包括挖掘出的用户的感兴趣度高于预设阈值的词汇。通过上述方法,通过分析用户输入的第一拼音串以及目标指令,可以挖掘出用户感兴趣的目标词汇,当用户再次输入目标词汇时便可一次命中,有效降低了用户的输入成本,提高用户的输入体验。

【技术实现步骤摘要】

本专利技术涉及数据挖掘,尤其涉及一种词汇挖掘方法、装置、电子设备及存储介质


技术介绍

1、高输入代价词是指用户感兴趣的词,例如网络梗词、偏僻词语。人们在使用拼音输入法输入高输入代价词时,如果候选词中没有用户想输入的词,用户就会回删拼音,通过多次输入拼音完成高输入代价词的输入,这极大的增加了用户的输入成本。

2、因此,如何挖掘用户的高输入代价词,有效降低用户的输入成本,提高用户的输入体验,是目前亟待解决的问题。


技术实现思路

1、针对现有技术存在的问题,本专利技术实施例提供一种词汇挖掘方法、装置、电子设备及存储介质。

2、本专利技术提供一种词汇挖掘方法,包括:

3、获取用户输入的第一拼音串,所述第一拼音串包括至少一个拼音组;

4、接收所述用户输入的目标指令,响应于所述目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇;

5、基于各所述拼音组对应的所述第一词汇,确定所述第一拼音串对应的目标代价词;所述目标代价词包括挖掘出的所述用户的感兴趣度高于预设阈值的词汇。

6、可选地,所述响应于所述用户的目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇,包括:

7、响应于所述用户的第一目标指令,基于各所述拼音组的排列顺序,依次从每一个拼音组对应的至少一个词汇中确定所述第一词汇。

8、可选地,所述响应于所述用户的目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇,包括:

9、响应于所述用户的第二目标指令,所述第二目标指令包括所述用户期望从所述第一拼音串中删除的至少一个第一拼音组;

10、将各所述第一拼音组从所述第一拼音串中删除,得到至少一个第二拼音组;

11、基于各所述第二拼音组的排列顺序,依次确定各所述第二拼音组对应的所述第一词汇;

12、响应于所述用户的第三目标指令,所述第三目标指令包括各所述第一拼音组;

13、基于各所述第一拼音组的排列顺序,依次确定各所述第一拼音组对应的所述第一词汇。

14、可选地,所述响应于所述用户的目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇,包括:

15、响应于所述用户的第四目标指令,从各所述拼音组对应的至少一个词汇中确定所述第一拼音串对应的第二词汇;所述第二词汇中包括至少一个第一词汇;

16、响应于所述用户的第五目标指令,所述第五目标指令包括至少一个第三词汇;各所述第三词汇为所述用户期望从所述第二词汇中删除的词汇;

17、从所述第二词汇中删除各所述第三词汇,并将剩余的所述第二词汇确定为所述第一词汇;

18、响应于所述用户的第六目标指令,所述第六目标指令包括各所述第三词汇对应的第二拼音串;

19、基于所述第二拼音串中各所述拼音组的排列顺序,依次确定所述第二拼音串中各所述拼音组对应的所述第一词汇。

20、可选地,所述方法还包括:

21、获取多个目标词汇以及每个目标词汇对应的用户数量;

22、基于所述多个目标词汇以及每个目标词汇对应的用户数量,生成目标词汇库。

23、可选地,所述基于所述多个目标词汇以及每个目标词汇对应的用户数量,生成目标词汇库,包括:

24、基于每个目标词汇对应的用户数量,对所述多个目标词汇按照用户数量从多到少的顺序进行排序;

25、将前预设数目个目标词汇进行存储,生成所述目标词汇库。

26、可选地,所述方法还包括:

27、获取用户输入的文本信息以及所述文本信息对应的拼音串;

28、将所述文本信息及所述文本信息对应的拼音串输入目标词汇标注模型,得到所述目标词汇标注模型输出的所述文本信息对应的目标词汇;所述目标词汇标注模型是基于所述多个目标词汇及所述多个目标词汇对应的拼音串训练得到的。

29、本专利技术还提供一种词汇挖掘装置,包括:

30、第一获取模块,用于获取用户输入的第一拼音串,所述第一拼音串包括至少一个拼音组;

31、第一确定模块,用于接收所述用户输入的目标指令,响应于所述目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇;

32、第二确定模块,用于基于各所述拼音组对应的所述第一词汇,确定所述第一拼音串对应的目标代价词;所述目标代价词包括挖掘出的所述用户的感兴趣度高于预设阈值的词汇。

33、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述词汇挖掘方法。

34、本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述词汇挖掘方法。

35、本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述词汇挖掘方法。

36、本专利技术提供的词汇挖掘方法、装置、电子设备及存储介质,通过获取用户输入的第一拼音串,然后接收用户输入的目标指令,响应于目标指令,基于第一拼音串,从各拼音组对应的至少一个词汇中确定各拼音组对应的第一词汇,基于各拼音组对应的第一词汇,确定第一拼音串对应的目标词汇;在上述方法中,通过分析用户输入的第一拼音串以及目标指令,可以挖掘出用户感兴趣的目标词汇,当用户再次输入目标词汇时便可一次命中,有效降低了用户的输入成本,提高用户的输入体验。

本文档来自技高网...

【技术保护点】

1.一种词汇挖掘方法,其特征在于,包括:

2.根据权利要求1所述的词汇挖掘方法,其特征在于,所述响应于所述用户的目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇,包括:

3.根据权利要求1所述的词汇挖掘方法,其特征在于,所述响应于所述用户的目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇,包括:

4.根据权利要求1所述的词汇挖掘方法,其特征在于,所述响应于所述用户的目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇,包括:

5.根据权利要求1至4中任一项所述的词汇挖掘方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的词汇挖掘方法,其特征在于,所述基于所述多个目标词汇以及每个目标词汇对应的用户数量,生成目标词汇库,包括:

7.根据权利要求5所述的词汇挖掘方法,其特征在于,所述方法还包括:

8.一种词汇挖掘装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述词汇挖掘方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述词汇挖掘方法。

...

【技术特征摘要】

1.一种词汇挖掘方法,其特征在于,包括:

2.根据权利要求1所述的词汇挖掘方法,其特征在于,所述响应于所述用户的目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇,包括:

3.根据权利要求1所述的词汇挖掘方法,其特征在于,所述响应于所述用户的目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇,包括:

4.根据权利要求1所述的词汇挖掘方法,其特征在于,所述响应于所述用户的目标指令,基于所述第一拼音串,从各所述拼音组对应的至少一个词汇中确定各所述拼音组对应的第一词汇,包括:

5.根据权利要求1至4中任一项所述的词汇挖...

【专利技术属性】
技术研发人员:周锋丁克玉
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1