一种基于阅读理解练习的词汇水平测试处理方法及系统技术方案

技术编号:29134027 阅读:18 留言:0更新日期:2021-07-02 22:29
本发明专利技术提出一种基于阅读理解练习的词汇水平测试处理方法及系统,包括如下步骤:阅读文本预处理步骤:服务端针对每一篇阅读理解文本text,计算文本中各个词语w在当前文本中的难度;然后,对文本中各单词按照难度由大到小的顺序排序并统计其出现次数;为用户提供测试内容并进行难词累计步骤;词汇认知水平评估步骤:在用户积累够预定规模的阅读理解题目后,将其所有遇到的难词以其在词汇词频表WordFreq中的词频百分比为系数进行累加平均,获得平均词频百分比信息,再从WordFreq中找到平均词频百分比相对应的词汇排位,进而确定该用户的词汇量;基于词汇评估的英文文本推荐步骤:根据用户的词汇量,服务端为其推荐相应的词汇学习和阅读文本,通过网络发送到用户的终端。

【技术实现步骤摘要】
一种基于阅读理解练习的词汇水平测试处理方法及系统
本专利技术属于计算机辅助英语教学领域,涉及英语学习者能力评估、英语学习语料推荐、英语学习材料自动分类等相关
,特别涉及一种基于阅读理解练习的词汇水平测试处理方法及系统。
技术介绍
词汇和语法是英语学习和英语教学中的两个重要方面。通常,各个英语语法点可以通过具体的习题来考察。尽管词汇也可以通过选择、填空等习题来考察,但其考察的通常只是测试者对某一个或某几个词汇的理解,这种练习很难衡量测试者对于英语词汇的整体把握情况。这对于英语词汇学习并不能提供有效地指导性意见。为此,本专利技术希望提供一套方案,以实现对测试者整体词汇水平的测试。当前,对测试者进行的词汇测试主要是通过听写、或是中英对照来完成的。尽管这些方式能够在一定程度上反映测试者的词汇量,但其所对应的是测试者中英文词汇对应的能力,与真实的英语理解存在一定差距。而真实的词汇使用是要在语篇中完成的。因此,通过阅读答题测试阅读者的词汇,将能够更好的反映出测试者在词汇使用方面的能力水平。
技术实现思路
为了解决上述技术问题,本专利技术通过利用服务端进行阅读文本预处理、难词累计、词汇认知水平评估等几个步骤,实现基于阅读理解练习的学生词汇量测试处理以及学习内容的推送处理。本专利技术的技术方案如下:一种基于阅读理解练习的词汇水平测试处理方法,包括如下步骤:阅读文本预处理步骤:服务端针对每一篇阅读理解文本text,计算文本中各个词语w在当前文本中的难度;然后,对文本中各单词按照难度由大到小的顺序排序并统计其出现次数;为用户提供测试内容并进行难词累计步骤:服务端为用户提供预定量的阅读理解题目,根据用户答题结果标注用户潜在的未掌握难词并进行累积;词汇认知水平评估步骤:在用户积累够预定规模的阅读理解题目后,将其所有遇到的难词以其在词汇词频表WordFreq中的词频百分比为系数进行累加平均,获得平均词频百分比信息,再从WordFreq中找到平均词频百分比相对应的词汇排位,进而确定该用户的词汇量;基于词汇评估的英文文本推荐步骤:根据用户的词汇量,服务端为其推荐相应的词汇学习和阅读文本,通过网络发送到用户的终端。进一步的,所述阅读文本预处理步骤:针对每一篇阅读理解文本text,计算文本中各个词语w在当前文本中的难度;然后,对文本中各单词按照难度由大到小的顺序排序并统计其出现次数,具体如下:步骤1.1将文本text中的所有单词变形转化为原形形式,单词变形包括:首字母大写、动词各种变形、名词复数变形、形容词/副词比较级和最高级变形等,假设文本中所有单词的原形构成的集合为WordSet,转步骤1.2;步骤1.2统计WordSet中各单词原形w及其变形在文本text中出现的次数,计为Count(w);统计text中词汇总数量,记为T,转步骤1.3;步骤1.3对WordSet中的每一个单词w,计算w在文本text中的难度,其中n=Count(w),转步骤1.4;步骤1.4将WordSet中的所有单词w按照其在文本text中的难度排序,将在当前文本中最难的词汇设为w1,次难词汇设为w2,其在文本中出现的次数相应记为n1,n2,...,以此类推;将这些单词及其在文本出现次数按降序插入键值对序列sortedWordMap<wi,ni>;键wi表示文本中难度排名第i位的单词,值ni存储难度排名第i位的单词在文本中出现的次数。进一步的,所述为用户提供测试内容并进行难词累计步骤:为用户提供预定量的阅读理解题目,根据用户答题结果标注用户潜在的未掌握难词并进行累积;具体如下:步骤2.1对于初次用户user,设置其难词累计表HardWord为空集,转步骤2.2;步骤2.2在用户的随后使用中,服务端根据教师指派或习题布置方式将阅读理解题目逐个发送到客户端让用户user练习,用户每完成一个阅读理解习题后,将答案上传服务器,转步骤2.3;步骤2.3根据用户user当前完成的阅读理解文本text及上传答题情况进行难词累加,假设text有K道习题且用户user答对C道题:如果C>0且C<K,则从sortedWordMap<wi,ni>中按难度从大到小顺序选择前(1-(C-1)/(K-1))*20%的词汇,设其为w1,...,wm,转步骤2.4;否则,转步骤2.5;步骤2.4对每一个wi,1<=i<=m,如果wi已在HardWord中,即HardWord(wi)不为零,则令HardWord(wi)=HardWord(wi)+1;否则,将wi加入HardWord,令HardWord(wi)=1;转步骤2.5;步骤2.5记录当前状态,若用户继续进行测试,转步骤2.2;否则,结束步骤2。进一步的,所述词汇认知水平评估步骤:在用户积累够预定规模的阅读理解题目后,将其所有遇到的难词以其在词汇词频表WordFreq中的词频百分比为系数进行累加平均,获得平均词频百分比信息,再从WordFreq中找到平均词频百分比相对应的词汇排位,进而确定该用户的词汇量,具体如下:步骤3.1对用户user累计的所有难词做频率加权:假设user所对应的HardWord中的所有难词分别为w1,w2,...,wH,其出现的累积次数分别N1,N2,...,NH,以及其在词汇词频表WordFreq中对应的词频百分比分别为P1,P2,...,PH,按照如下公式(4)计算难词平均词频,转步骤3.2;步骤3.2对WordFreq中的所有词汇按照频率百分比由大到小的顺序排序,设第K个词汇的频率大于HP,而第K+1个词汇的频率小于等于HP;则K就可视为是该学生的词汇量,将第K个词汇的频率记为KH。进一步的,所述基于词汇评估的英文文本推荐步骤:根据用户的词汇量,服务端为其推荐相应的词汇学习和阅读文本,通过网络发送到用户的终端具体包括:以K为基础,为用户推荐相应的词汇学习和阅读文本,具体的,对于语料库中的文本text,如果其按照词汇在文本中的难度计算,前20%难词的词频有一半以上都在KH以后,或者如果这些词都不在KH以后,则不推送内容;在这两种情况之外,则服务端将内容推送处理到客户端。根据本专利技术的另一方面,还提出一种基于阅读理解练习的词汇水平测试处理系统,包括客户端和服务端;所述客户端包括:用户登录模块,用户在客户端输入用户名和密码,由客户端经安全加密处理后发送给服务端;服务端对收到数据做解密等相应安全处理,获得用户名和密码,并在库中比对进行如下相应操作:如果收到的用户名与密码与服务端存储的某一用户名-密码匹配,则根据用户学习数据提供相应服务;否则,提示用户核对用户名与密码,再次尝试;用户阅读答题模块,用户根据学习需求,完成系统或教师指派的阅读理解文本并答题,题目信息及答题结果会返回给服务端;所述服务端包括:阅读文本预处理模块,用于对服务端存储的所有阅读理解文本进行预处理,生成各篇文本中词汇难度本文档来自技高网...

【技术保护点】
1.一种基于阅读理解练习的词汇水平测试处理方法,其特征在于,包括如下步骤:/n阅读文本预处理步骤:服务端针对每一篇阅读理解文本text,计算文本中各个词语w在当前文本中的难度;然后,对文本中各单词按照难度由大到小的顺序排序并统计其出现次数;/n为用户提供测试内容并进行难词累计步骤:服务端为用户提供预定量的阅读理解题目,根据用户答题结果标注用户潜在的未掌握难词并进行累积;/n词汇认知水平评估步骤:在用户积累够预定规模的阅读理解题目后,将其所有遇到的难词以其在词汇词频表WordFreq中的词频百分比为系数进行累加平均,获得平均词频百分比信息,再从WordFreq中找到平均词频百分比相对应的词汇排位,进而确定该用户的词汇量;/n基于词汇评估的英文文本推荐步骤:根据用户的词汇量,服务端为其推荐相应的词汇学习和阅读文本,通过网络发送到用户的终端。/n

【技术特征摘要】
1.一种基于阅读理解练习的词汇水平测试处理方法,其特征在于,包括如下步骤:
阅读文本预处理步骤:服务端针对每一篇阅读理解文本text,计算文本中各个词语w在当前文本中的难度;然后,对文本中各单词按照难度由大到小的顺序排序并统计其出现次数;
为用户提供测试内容并进行难词累计步骤:服务端为用户提供预定量的阅读理解题目,根据用户答题结果标注用户潜在的未掌握难词并进行累积;
词汇认知水平评估步骤:在用户积累够预定规模的阅读理解题目后,将其所有遇到的难词以其在词汇词频表WordFreq中的词频百分比为系数进行累加平均,获得平均词频百分比信息,再从WordFreq中找到平均词频百分比相对应的词汇排位,进而确定该用户的词汇量;
基于词汇评估的英文文本推荐步骤:根据用户的词汇量,服务端为其推荐相应的词汇学习和阅读文本,通过网络发送到用户的终端。


2.根据权利要求1所述的一种基于阅读理解练习的词汇水平测试处理方法,其特征在于,所述阅读文本预处理步骤:针对每一篇阅读理解文本text,计算文本中各个词语w在当前文本中的难度;然后,对文本中各单词按照难度由大到小的顺序排序并统计其出现次数,具体如下:
步骤1.1将文本text中的所有单词变形转化为原形形式,单词变形包括:首字母大写、动词各种变形、名词复数变形、形容词/副词比较级和最高级变形等,假设文本中所有单词的原形构成的集合为WordSet,转步骤1.2;
步骤1.2统计WordSet中各单词原形w及其变形在文本text中出现的次数,计为Count(w);统计text中词汇总数量,记为T,转步骤1.3;
步骤1.3对WordSet中的每一个单词w,计算w在文本text中的难度,其中n=Count(w),转步骤1.4;
步骤1.4将WordSet中的所有单词w按照其在文本text中的难度排序,将在当前文本中最难的词汇设为w1,次难词汇设为w2,其在文本中出现的次数相应记为n1,n2,...,以此类推;将这些单词及其在文本出现次数按降序插入键值对序列sortedWordMap<wi,ni>;键wi表示文本中难度排名第i位的单词,值ni存储难度排名第i位的单词在文本中出现的次数。


3.根据权利要求1所述的一种基于阅读理解练习的词汇水平测试处理方法,其特征在于,所述为用户提供测试内容并进行难词累计步骤:为用户提供预定量的阅读理解题目,根据用户答题结果标注用户潜在的未掌握难词并进行累积;具体如下:
步骤2.1对于初次用户user,设置其难词累计表HardWord为空集,转步骤2.2;
步骤2.2在用户的随后使用中,服务端根据教师指派或习题布置方式将阅读理解题目逐个发送到客户端让用户user练习,用户每完成一个阅读理解习题后,将答案上传服务器,转步骤2.3;
步骤2.3根据用户user当前完成的阅读理解文本text及上传答题情况进行难词累加,假设text有K道习题且用户user答对C道题:如果C>0且C<K,则从sortedWordMap<wi,ni>中按难度从大到小顺序选择前(1-(C-1)/(K-1))*20%的词汇,设其为w1,...,wm,转步骤2.4;否则,转步骤2.5;
步骤2.4对每一个wi,1<=i<=m,如果wi已在HardWord中,即HardWord(wi)不为零,则令Ha...

【专利技术属性】
技术研发人员:蒋东辰李萍陈轶阳康鑫隗艳萍孙艳
申请(专利权)人:广州摩翼信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1