【技术实现步骤摘要】
一种词汇处理方法、装置、设备及存储介质
[0001]本公开涉及但不限于词汇信息处理
,尤其涉及一种词汇处理方法、装置、设备及存储介质。
技术介绍
[0002]在经济全球化的背景下,在工作、学习和生活中,不可避免地会更多地遇到使用外语的情况。因此,越来越多的人需要或者想要学习除了母语之外的一种甚至多种语言。特别是,英语、法语、德语、西班牙语甚至意大利语这些语言的学习者日益增多。对于这些语言学习者而言,想要掌握一种语言,对于词汇的学习则是最基础且最重要的。
[0003]在语言学习中,语言学习者首先需要对单词进行记忆。特别是,语言的学习是循序渐进的过程,这就意味着将语言的学习过程分为多个阶段。相应地,也需要根据复杂程度、出现频率等将语言的词汇从简单到困难分为不同词汇集合。举例来说,对于中国的英语学习者而言,在大学时有CET
‑
4、CET
‑
6、TEM
‑
4、TEM
‑
8等不同的等级考试,对应不同的学习阶段,更进一步对应不同的词汇集合。
[ ...
【技术保护点】
【技术特征摘要】
1.一种词汇处理方法,其特征在于,包括:确定目标词汇,其中,所述目标词汇包括至少一个词汇;获得语料数据,其中,所述语料数据至少包括多个语句,并且所述多个语句中的至少一个语句中包含所述目标词汇;基于所述语料数据和所述目标词汇,确定所述目标词汇中包含的第一词汇作为第一词设使用的词设统计数据和所述第一词汇的词汇统计数据;根据所述词设统计数据和所述词汇统计数据,确定所述第一词汇作为所述第一词设使用的期望信息;以及根据所述期望信息,确定所述第一词汇的第一特性,其中,所述第一特性至少是所述第一词汇的具有最大期望的词设。2.根据权利要求1所述的方法,其特征在于,所述根据所述词设统计数据和所述词汇统计数据,确定所述第一词汇作为所述第一词设使用的期望信息,包括:根据所述词设统计数据和所述词汇统计数据,确定第一期望值,其中,所述第一期望值是所述第一词汇在所述目标词汇中作为所述第一词设使用的次数的期望值;根据所述词设统计数据和所述词汇统计数据,确定第二期望值,其中,所述第二期望值是所述第一词汇在所述语料数据中作为所述第一词设使用的次数的期望值;以及根据所述第一期望值和所述第二期望值,确定所述第一词汇作为所述第一词设使用的次数的期望值。3.根据权利要求2所述的方法,其特征在于,所述词设统计数据包括所述第一词汇在所述目标词汇中作为所述第一词设的第一使用次数、以及所述第一词汇在所述语料数据中作为所述第一词设的第二使用次数,所述词汇统计数据包括所述第一词汇在所述目标词汇中的第一出现次数、以及所述第一词汇在所述语料数据中的第二出现次数,其中,根据所述词设统计数据和所述词汇统计数据,确定所述第一词汇作为所述第一词设使用的期望信息,包括:根据所述第一使用次数、所述第二使用次数、所述第一出现次数和所述第二出现次数,确定所述第一期望值;根据所述第一使用次数、所述第二使用次数、所述第一出现次数和所述第二出现次数,确定所述第二期望值;以及根据所述第一期望值和所述第二期望值,确定所述第一词汇作为所述第一词设使用的次数的期望值。4.根据权利要求2所述的方法,其特征在于,根据所述期望信息,确定所述第一词汇的第一特性,包括:判断所述第一词汇作为所述第一词设使用的次数的期望值是否大于所述第一词汇作为第二词设使用的次数的期望值,其中,所述第二词设不同于所述第一词设;以及当确定所述第一词汇作为所述第一词设使用的次数的期望值大于所述第一词汇作为第二词设使用的次数的期望值时,将所述第一词设设置为所述第一词汇的所述第一特性。5.根据权利要求2至4中任一项所述的方法,...
【专利技术属性】
技术研发人员:李晟,李佳贞,冯烨,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。