一种基于阅读理解练习的词汇水平测试处理方法及系统技术方案

技术编号：29134027 阅读：31 留言：0更新日期：2021-07-02 22:29

本发明专利技术提出一种基于阅读理解练习的词汇水平测试处理方法及系统，包括如下步骤：阅读文本预处理步骤：服务端针对每一篇阅读理解文本text，计算文本中各个词语w在当前文本中的难度；然后，对文本中各单词按照难度由大到小的顺序排序并统计其出现次数；为用户提供测试内容并进行难词累计步骤；词汇认知水平评估步骤：在用户积累够预定规模的阅读理解题目后，将其所有遇到的难词以其在词汇词频表WordFreq中的词频百分比为系数进行累加平均，获得平均词频百分比信息，再从WordFreq中找到平均词频百分比相对应的词汇排位，进而确定该用户的词汇量；基于词汇评估的英文文本推荐步骤：根据用户的词汇量，服务端为其推荐相应的词汇学习和阅读文本，通过网络发送到用户的终端。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于阅读理解练习的词汇水平测试处理方法及系统
本专利技术属于计算机辅助英语教学领域，涉及英语学习者能力评估、英语学习语料推荐、英语学习材料自动分类等相关
，特别涉及一种基于阅读理解练习的词汇水平测试处理方法及系统。
技术介绍
词汇和语法是英语学习和英语教学中的两个重要方面。通常，各个英语语法点可以通过具体的习题来考察。尽管词汇也可以通过选择、填空等习题来考察，但其考察的通常只是测试者对某一个或某几个词汇的理解，这种练习很难衡量测试者对于英语词汇的整体把握情况。这对于英语词汇学习并不能提供有效地指导性意见。为此，本专利技术希望提供一套方案，以实现对测试者整体词汇水平的测试。当前，对测试者进行的词汇测试主要是通过听写、或是中英对照来完成的。尽管这些方式能够在一定程度上反映测试者的词汇量，但其所对应的是测试者中英文词汇对应的能力，与真实的英语理解存在一定差距。而真实的词汇使用是要在语篇中完成的。因此，通过阅读答题测试阅读者的词汇，将能够更好的反映出测试者在词汇使用方面的能力水平。
技术实现思路
>为了解决上述技术问本文档来自技高网...

【技术保护点】
1.一种基于阅读理解练习的词汇水平测试处理方法，其特征在于，包括如下步骤：/n阅读文本预处理步骤：服务端针对每一篇阅读理解文本text，计算文本中各个词语w在当前文本中的难度；然后，对文本中各单词按照难度由大到小的顺序排序并统计其出现次数；/n为用户提供测试内容并进行难词累计步骤：服务端为用户提供预定量的阅读理解题目，根据用户答题结果标注用户潜在的未掌握难词并进行累积；/n词汇认知水平评估步骤：在用户积累够预定规模的阅读理解题目后，将其所有遇到的难词以其在词汇词频表WordFreq中的词频百分比为系数进行累加平均，获得平均词频百分比信息，再从WordFreq中找到平均词频百分比相对应的词汇排位...

【技术特征摘要】
1.一种基于阅读理解练习的词汇水平测试处理方法，其特征在于，包括如下步骤：
阅读文本预处理步骤：服务端针对每一篇阅读理解文本text，计算文本中各个词语w在当前文本中的难度；然后，对文本中各单词按照难度由大到小的顺序排序并统计其出现次数；
为用户提供测试内容并进行难词累计步骤：服务端为用户提供预定量的阅读理解题目，根据用户答题结果标注用户潜在的未掌握难词并进行累积；
词汇认知水平评估步骤：在用户积累够预定规模的阅读理解题目后，将其所有遇到的难词以其在词汇词频表WordFreq中的词频百分比为系数进行累加平均，获得平均词频百分比信息，再从WordFreq中找到平均词频百分比相对应的词汇排位，进而确定该用户的词汇量；
基于词汇评估的英文文本推荐步骤：根据用户的词汇量，服务端为其推荐相应的词汇学习和阅读文本，通过网络发送到用户的终端。

2.根据权利要求1所述的一种基于阅读理解练习的词汇水平测试处理方法，其特征在于，所述阅读文本预处理步骤：针对每一篇阅读理解文本text，计算文本中各个词语w在当前文本中的难度；然后，对文本中各单词按照难度由大到小的顺序排序并统计其出现次数，具体如下：
步骤1.1将文本text中的所有单词变形转化为原形形式，单词变形包括：首字母大写、动词各种变形、名词复数变形、形容词/副词比较级和最高级变形等，假设文本中所有单词的原形构成的集合为WordSet，转步骤1.2；
步骤1.2统计WordSet中各单词原形w及其变形在文本text中出现的次数，计为Count(w)；统计text中词汇总数量，记为T，转步骤1.3；
步骤1.3对WordSet中的每一个单词w，计算w在文本text中的难度，其中n＝Count(w)，转步骤1.4；
步骤1.4将WordSet中的所有单词w按照其在文本text中的难度排序，将在当前文本中最难的词汇设为w1，次难词汇设为w2，其在文本中出现的次数相应记为n1,n2,...，以此类推；将这些单词及其在文本出现次数按降序插入键值对序列sortedWordMap<wi,ni>；键wi表示文本中难度排名第i位的单词，值ni存储难度排名第i位的单词在文本中出现的次数。

3.根据权利要求1所述的一种基于阅读理解练习的词汇水平测试处理方法，其特征在于，所述为用户提供测试内容并进行难词累计步骤：为用户提供预定量的阅读理解题目，根据用户答题结果标注用户潜在的未掌握难词并进行累积；具体如下：
步骤2.1对于初次用户user，设置其难词累计表HardWord为空集，转步骤2.2；
步骤2.2在用户的随后使用中，服务端根据教师指派或习题布置方式将阅读理解题目逐个发送到客户端让用户user练习，用户每完成一个阅读理解习题后，将答案上传服务器，转步骤2.3；
步骤2.3根据用户user当前完成的阅读理解文本text及上传答题情况进行难词累加，假设text有K道习题且用户user答对C道题：如果C>0且C<K，则从sortedWordMap<wi,ni>中按难度从大到小顺序选择前(1-(C-1)/(K-1))*20％的词汇，设其为w1,...,wm，转步骤2.4；否则，转步骤2.5；
步骤2.4对每一个wi，1<＝i<＝m，如果wi已在HardWord中，即HardWord(wi)不为零，则令Ha...

【专利技术属性】
技术研发人员：蒋东辰，李萍，陈轶阳，康鑫，隗艳萍，孙艳，
申请(专利权)人：广州摩翼信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人