【技术实现步骤摘要】
词汇量预测方法、装置、存储介质以及计算机设备
[0001]本申请涉及计算机领域,具体而言,涉及一种词汇量预测方法、装置、存储介质和计算机设备。
技术介绍
[0002]随着在线教育行业的兴起,越来越多的用户会通过学习软件来进行语言学习。为了检验自己的学习成果,用户会通过使用学习软件的词汇量预测功能来进行词汇量预测,从而预测出用户自己的词汇量水平。
[0003]现有的词汇量预测方法是随机选择词库中的分级词汇,然后基于选中的分级词汇生成测试题供用户作答,再基于测试结果进行词汇预测,则所得到的预测结果仅表示了用户的背单词水平。根据语言的特性可知,能正确的使用(如连词成句)才是真正的掌握了这个词汇,而仅仅将词汇背出/写出,无法体现用户的词汇掌握水平,进而无法判断用户背出/写出的词汇是否属于用户掌握的词汇。因此,现有的词汇量预测方法无法得出用户的真实词汇量水平,词汇量的预测准确率较低。
技术实现思路
[0004]本申请提供一种词汇量预测方法、装置、存储介质以及计算机设备,可以解决如何提高词汇量的预测准确率的技术问题。
[0005]第一方面,本申请实施例提供一种词汇量预测方法,该方法包括:
[0006]获取针对目标用户的目标文本,获取所述目标文本中的各第一目标词汇以及各第一目标词汇之间的顺序关系;
[0007]采用等级评估模型,基于所述各第一目标词汇以及所述各第一目标词汇之间的顺序关系,获取所述目标文本的目标文本等级;
[0008]采用词汇量预测模型,基于所述各第一目标词汇以 ...
【技术保护点】
【技术特征摘要】
1.一种词汇量预测方法,其特征在于,所述方法包括:获取针对目标用户的目标文本,获取所述目标文本中的各第一目标词汇以及各第一目标词汇之间的顺序关系;采用等级评估模型,基于所述各第一目标词汇以及所述各第一目标词汇之间的顺序关系,获取所述目标文本的目标文本等级;采用词汇量预测模型,基于所述各第一目标词汇以及所述各第一目标词汇对应的词汇等级,获取所述目标文本对应的文本词汇量;基于所述目标文本等级对应的目标等级词汇量以及所述文本词汇量,确定所述目标用户的预测词汇量。2.根据权利要求1所述的方法,其特征在于,所述获取针对目标用户的目标文本之前,还包括:接收第一数量的第一训练文本以及所述第一训练文本对应的第一文本等级,获取所述第一训练文本中的各第一训练词汇以及各第一训练词汇之间的顺序关系;基于所述第一训练文本中的各第一训练词汇以及各第一训练词汇之间的顺序关系、所述第一训练文本对应的第一文本等级,对等级评估模型进行模型训练,得到训练后的所述等级评估模型。3.根据权利要求1所述的方法,其特征在于,所述获取针对目标用户的目标文本之前,还包括:接收第二数量的第二训练文本以及所述第二训练文本对应的第二文本等级,获取所述第二训练文本中的各第二训练词汇以及各第二训练词汇对应的词汇等级;基于所述第二训练文本对应的第二文本等级获取所述第二训练文本对应的训练等级词汇量;基于所述第二训练文本中的各第二训练词汇以及各第二训练词汇对应的词汇等级、所述第二训练文本对应的训练等级词汇量,对词汇量预测模型进行模型训练,得到训练后的所述词汇量预测模型。4.根据权利要求3所述的方法,其特征在于,所述基于所述第二训练文本中的各第二训练词汇以及各第二训练词汇对应的词汇等级、所述第二训练文本对应的训练等级词汇量,对词汇量预测模型进行模型训练,得到训练后的所述词汇量预测模型,包括:基于所述第二训练文本的各第二训练词汇以及各第二训练词汇对应的词汇等级,获取所述第二训练文本中的训练词汇总数以及各词汇等级的训练词汇个数;基于所述第二训练文本中的训练词汇总数以及各词汇等级的训练词汇个数、所述第二训练文本对应的训练等级词汇量,对词汇量预测模型进行模型训练,得到训练后的所述词汇量预测模型。5.根据权利要求3所述的方法,其特征在于,所述获取所述第二训练文本中的各第二训练词汇以及各第二训练词汇对应的词汇等级,包括:对所述第二训练文本中的各初始训练词汇进行词汇处理,得到所述第二训练文本对应的各第二训练词汇,所述词汇处理包括词汇归一化处理、关键词汇去除处理以及词汇去重处理中的至少一种;获取所述各第二训练词汇对应的词汇等级。
6.根据权利要求1所述的方法,其特征在于,所述采用词汇量预测模型,基于所述各第一目标词汇以及所述各第一目标词汇对应的词汇等级,获取所述目标文本对应的文本词汇量,包括:对所述目标文本中的各第一目标词汇进行词汇处理,得到所述目标文本对应的第二目标词汇,所述词汇处理包括词汇归一化处理、关键词汇去除处理以及词汇去重处理中的至少一种;获取所述各第二目标词汇对应...
【专利技术属性】
技术研发人员:陈松灿,
申请(专利权)人:广州视源创新科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。