词汇量预测方法、装置、存储介质以及计算机设备制造方法及图纸

技术编号:37490078 阅读:21 留言:0更新日期:2023-05-07 09:29
本申请公开了一种词汇量预测方法、装置、存储介质和计算机设备,其中方法包括:获取针对目标用户的目标文本,获取所述目标文本中的各第一目标词汇以及各第一目标词汇之间的顺序关系;采用等级评估模型,基于所述各第一目标词汇以及所述各第一目标词汇之间的顺序关系,获取所述目标文本的目标文本等级;采用词汇量预测模型,基于所述各第一目标词汇以及所述各第一目标词汇对应的词汇等级,获取所述目标文本对应的文本词汇量;基于所述目标文本等级对应的目标等级词汇量以及所述文本词汇量,确定所述目标用户的预测词汇量。采用本申请,提高了词汇量的预测准确率。提高了词汇量的预测准确率。提高了词汇量的预测准确率。

【技术实现步骤摘要】
词汇量预测方法、装置、存储介质以及计算机设备


[0001]本申请涉及计算机领域,具体而言,涉及一种词汇量预测方法、装置、存储介质和计算机设备。

技术介绍

[0002]随着在线教育行业的兴起,越来越多的用户会通过学习软件来进行语言学习。为了检验自己的学习成果,用户会通过使用学习软件的词汇量预测功能来进行词汇量预测,从而预测出用户自己的词汇量水平。
[0003]现有的词汇量预测方法是随机选择词库中的分级词汇,然后基于选中的分级词汇生成测试题供用户作答,再基于测试结果进行词汇预测,则所得到的预测结果仅表示了用户的背单词水平。根据语言的特性可知,能正确的使用(如连词成句)才是真正的掌握了这个词汇,而仅仅将词汇背出/写出,无法体现用户的词汇掌握水平,进而无法判断用户背出/写出的词汇是否属于用户掌握的词汇。因此,现有的词汇量预测方法无法得出用户的真实词汇量水平,词汇量的预测准确率较低。

技术实现思路

[0004]本申请提供一种词汇量预测方法、装置、存储介质以及计算机设备,可以解决如何提高词汇量的预测准确率的技术问题。
[0005]第一方面,本申请实施例提供一种词汇量预测方法,该方法包括:
[0006]获取针对目标用户的目标文本,获取所述目标文本中的各第一目标词汇以及各第一目标词汇之间的顺序关系;
[0007]采用等级评估模型,基于所述各第一目标词汇以及所述各第一目标词汇之间的顺序关系,获取所述目标文本的目标文本等级;
[0008]采用词汇量预测模型,基于所述各第一目标词汇以及所述各第一目标词汇对应的词汇等级,获取所述目标文本对应的文本词汇量;
[0009]基于所述目标文本等级对应的目标等级词汇量以及所述文本词汇量,确定所述目标用户的预测词汇量。
[0010]第二方面,本申请实施例提供一种词汇量预测装置,包括:
[0011]获取模块,用于获取针对目标用户的目标文本,获取所述目标文本中的各第一目标词汇以及各第一目标词汇之间的顺序关系;
[0012]等级获取模块,用于采用等级评估模型,基于所述各第一目标词汇以及所述各第一目标词汇之间的顺序关系,获取所述目标文本的目标文本等级;
[0013]词汇量获取模块,用于采用词汇量预测模型,基于所述各第一目标词汇以及所述各第一目标词汇对应的词汇等级,获取所述目标文本对应的文本词汇量;
[0014]确定模块,用于基于所述目标文本等级对应的目标等级词汇量以及所述文本词汇量,确定所述目标用户的预测词汇量。
[0015]第三方面,本申请实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行上述方法的步骤。
[0016]第四方面,本申请实施例提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的方法的步骤。
[0017]在本申请实施例中,通过采用等级评估模型对目标用户的目标文本进行文本等级的评估,同时结合词汇量预测模型确定目标文本对应的文本词汇量,最后基于目标文本的文本等级所对应的等级词汇量以及目标文本对应的文本词汇量,来确定目标用户的预测词汇量,通过采用用户的文本,以反映用户对词汇的理解程度的文本角度出发,并结合等级评估模型以及词汇量预测模型对用户的词汇量水平进行预测,保证了词汇量预测的合理性,提高了词汇量预测的准确率。
附图说明
[0018]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本申请实施例提供的一种词汇量预测方法的流程示意图;
[0020]图2为本申请实施例提供的一种词汇量预测方法的流程示意图;
[0021]图3为本申请实施例提供的一种词汇量预测方法的流程示意图;
[0022]图4为本申请实施例提供的一种词汇量预测方法的流程示意图;
[0023]图5为本申请实施例提供的一种词汇量预测方法的流程示意图;
[0024]图6为本申请实施例提供的一种词汇量预测方法的流程示意图;
[0025]图7为本申请实施例提供的一种词汇量预测装置的结构示意图;
[0026]图8为本申请实施例提供的一种词汇量预测装置的结构示意图;
[0027]图9是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0028]为使得本申请的特征和优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0029]下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。附图中所示的流程图仅是示例性说明,不是必须按照所示步骤执行。例如,有的步骤是并列的,在逻辑上并没有严格的先后关系,因此实际执行顺序是可变的。另外,术语“第一”、“第二”、“第三”、“第四”、“第五”、“第六”、“第七”、“第八”仅是为了区分的目的,不应作为本公开内容的限制。
[0030]下面将结合图1

图7,对本申请实施例提供的词汇量预测方法进行详细介绍。
[0031]请参见图1,为本申请实施例提供了一种词汇量预测方法的流程示意图。如图1所示,所述方法可以包括以下步骤S101

步骤S104。
[0032]S101,获取针对目标用户的目标文本,获取所述目标文本中的各第一目标词汇以及各第一目标词汇之间的顺序关系。
[0033]具体的,目标文本是用于预测目标用户的词汇量的文本材料,该文本材料可以是目标用户所撰写的文章,可选的,该文章包括标题以及正文内容。由于文本是一种书面语言的表现形式,具体来说是一个句子或多个句子的组合,且句子是由词汇以及词汇之间的顺序关系组成,则可以理解的是,目标文本中包括了至少一个第一目标词汇以及各第一目标词汇之间的顺序关系。
[0034]词汇量预测装置先获取针对目标用户的目标文本,然后基于目标文本获取目标文本中的各第一目标词汇以及各第一目标词汇之间的顺序关系。
[0035]S102,采用等级评估模型,基于所述各第一目标词汇以及所述各第一目标词汇之间的顺序关系,获取所述目标文本的目标文本等级。
[0036]具体的,等级评估模型是用于评估文本的文本等级的评估模型,其中,文本等级用于表示文本的文本水平;示例性的,本实施例将文本等级分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种词汇量预测方法,其特征在于,所述方法包括:获取针对目标用户的目标文本,获取所述目标文本中的各第一目标词汇以及各第一目标词汇之间的顺序关系;采用等级评估模型,基于所述各第一目标词汇以及所述各第一目标词汇之间的顺序关系,获取所述目标文本的目标文本等级;采用词汇量预测模型,基于所述各第一目标词汇以及所述各第一目标词汇对应的词汇等级,获取所述目标文本对应的文本词汇量;基于所述目标文本等级对应的目标等级词汇量以及所述文本词汇量,确定所述目标用户的预测词汇量。2.根据权利要求1所述的方法,其特征在于,所述获取针对目标用户的目标文本之前,还包括:接收第一数量的第一训练文本以及所述第一训练文本对应的第一文本等级,获取所述第一训练文本中的各第一训练词汇以及各第一训练词汇之间的顺序关系;基于所述第一训练文本中的各第一训练词汇以及各第一训练词汇之间的顺序关系、所述第一训练文本对应的第一文本等级,对等级评估模型进行模型训练,得到训练后的所述等级评估模型。3.根据权利要求1所述的方法,其特征在于,所述获取针对目标用户的目标文本之前,还包括:接收第二数量的第二训练文本以及所述第二训练文本对应的第二文本等级,获取所述第二训练文本中的各第二训练词汇以及各第二训练词汇对应的词汇等级;基于所述第二训练文本对应的第二文本等级获取所述第二训练文本对应的训练等级词汇量;基于所述第二训练文本中的各第二训练词汇以及各第二训练词汇对应的词汇等级、所述第二训练文本对应的训练等级词汇量,对词汇量预测模型进行模型训练,得到训练后的所述词汇量预测模型。4.根据权利要求3所述的方法,其特征在于,所述基于所述第二训练文本中的各第二训练词汇以及各第二训练词汇对应的词汇等级、所述第二训练文本对应的训练等级词汇量,对词汇量预测模型进行模型训练,得到训练后的所述词汇量预测模型,包括:基于所述第二训练文本的各第二训练词汇以及各第二训练词汇对应的词汇等级,获取所述第二训练文本中的训练词汇总数以及各词汇等级的训练词汇个数;基于所述第二训练文本中的训练词汇总数以及各词汇等级的训练词汇个数、所述第二训练文本对应的训练等级词汇量,对词汇量预测模型进行模型训练,得到训练后的所述词汇量预测模型。5.根据权利要求3所述的方法,其特征在于,所述获取所述第二训练文本中的各第二训练词汇以及各第二训练词汇对应的词汇等级,包括:对所述第二训练文本中的各初始训练词汇进行词汇处理,得到所述第二训练文本对应的各第二训练词汇,所述词汇处理包括词汇归一化处理、关键词汇去除处理以及词汇去重处理中的至少一种;获取所述各第二训练词汇对应的词汇等级。
6.根据权利要求1所述的方法,其特征在于,所述采用词汇量预测模型,基于所述各第一目标词汇以及所述各第一目标词汇对应的词汇等级,获取所述目标文本对应的文本词汇量,包括:对所述目标文本中的各第一目标词汇进行词汇处理,得到所述目标文本对应的第二目标词汇,所述词汇处理包括词汇归一化处理、关键词汇去除处理以及词汇去重处理中的至少一种;获取所述各第二目标词汇对应...

【专利技术属性】
技术研发人员:陈松灿
申请(专利权)人:广州视源创新科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1