一种基于文本语言变量的汉语阅读能力的分级方法技术

技术编号：15822622 阅读：49 留言：0更新日期：2017-07-15 04:51

本发明专利技术公开了一种基于文本语言变量的汉语阅读能力的分级方法，包括以下步骤：1)在文本中找到阅读理解问题的答案所涉及的文本片段，确定源文本；2)计算步骤1)源文本的语言变量，作为自变量；3)将被试的阅读理解得分视作阅读理解能力和文本难度的指代，作为因变量；4)计算步骤2)自变量和步骤3)因变量之间的皮尔逊积差相关系数；5)对步骤4)的相关系数由高到低进行排序，筛选出排序前5的自变量，采用最小二乘法确定预测因变量的最佳自变量，导出最佳匹配函数。本发明专利技术方法区分了阅读理解测试和非阅读理解测试中的阅读的认知特点，拟合优度高，符合汉语的语言特点；计算简单快速，具有扩展性，准确度高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本语言变量的汉语阅读能力的分级方法
本专利技术属于阅读能力的分级方法
，特别是一种基于文本语言变量的汉语阅读能力的分级方法。
技术介绍
阅读理解能力是一种内隐的能力，判断阅读理解能力水平需要找到物理性质的可观察的指代，这种指代就是文本的语言变量。在英语国家，文本分级常用的方法是：将学生的阅读理解得分作为阅读文本的难度得分，采用最小二乘法计算和筛选预测文本难度得分的最佳语言变量。该方法存在的问题是：学生的阅读理解得分受到阅读理解问题的影响，即相同的文本，不同的阅读理解问题，学生的得分可能完全不同，但是英语国家的研究者并没有计算阅读理解问题是如何影响阅读理解得分的，这种忽略很可能使得阅读理解得分难以真实的反映阅读文本的难度。在汉语的阅读分级研究中，繁体和简体中文的文本分级方法多借鉴英语国家研究者的方法，具有一定的合理性。但是英语为拼音文字，重形合，汉语为表意文字，重意合，英语文本难度的最佳预测变量对汉语不一定有适合性。在具体的方法上，汉语研究者计算文本全文中所含的音节数量、笔画数量、词长、词频、句长等变量，将这些变量作为自变量，将学生所在的年级或者阅读理解得分作为因变量，采用回归分析，找到最佳匹配的函数公式。这些研究忽略了阅读理解测试时的阅读方法和非测试时的阅读方法之间的差异。例如，如果阅读理解问题涉及到某个难词，学生对该难词的处理水平就极大的影响了他的阅读理解得分(即作为因变量的文本难度得分)，而在非测试的阅读时，学生则可以跳过该词。换言之，学生在这两种情况下对同一语言变量的处理不同，学生对难度的感知不同，但是现有研究并没有进行区分。专利技术...
一种基于文本语言变量的汉语阅读能力的分级方法

【技术保护点】
一种基于文本语言变量的汉语阅读能力的分级方法，其特征在于：包括以下步骤：1)确定阅读理解测试的被试、文本和阅读理解问题，在所述文本中找到对应于每道所述阅读理解问题的答案所涉及的文本片段，作为源文本；2)分别计算步骤1)每道所述阅读理解问题对应的源文本的语言变量，作为自变量；3)用步骤1)的文本和所述阅读理解问题测试被试，将被试的阅读理解得分指代阅读理解能力，作为因变量；4)计算步骤2)自变量和步骤3)因变量之间的皮尔逊积差相关系数；5)对步骤4)所得的相关系数由高到低进行排序，筛选出排序在前5位的自变量，采用最小二乘法确定预测因变量的最佳语言变量，导出最佳匹配函数。

【技术特征摘要】
1.一种基于文本语言变量的汉语阅读能力的分级方法，其特征在于：包括以下步骤：1)确定阅读理解测试的被试、文本和阅读理解问题，在所述文本中找到对应于每道所述阅读理解问题的答案所涉及的文本片段，作为源文本；2)分别计算步骤1)每道所述阅读理解问题对应的源文本的语言变量，作为自变量；3)用步骤1)的文本和所述阅读理解问题测试被试，将被试的阅读理解得分指代阅读理解能力，作为因变量；4)计算步骤2)自变量和步骤3)因变量之间的皮尔逊积差相关系数；5)对步骤4)所得的相关系数由高到低进行排序，筛选出排序在前5位的自变量，采用最小二乘法确定预测因变量的最佳语言变量，导出最佳匹配函数。2.如权利要求1所述的一种基于文本语言变量的汉语阅读能力的分级方法，其特征在于：所述步骤1)中阅读理解问题的类型为反映被试阅读理解心理的全部过程，包括感觉、知觉、记忆、思维和想象。3.如权利要求1所述的一种基于文本语言变量的汉语阅读能力的分级方法，其特征在于：所述步骤2)中的自变量有6类，该6类自变量分别为字、词、句、段落、篇章和词语联结；所述自变量的计算方法为：采用汉语词频工具计算词的重复次数，采用ChineseTextAnalyzer软件和《现代汉语语料库词频表》计算熟词，采用文本可读性指标自动化分析系统分别计算词语联结和笔画数。4.如权利要求1所述的一种基于文本语言变量的汉语阅读能力的分级方法，其特征在于：所述步骤3)的因变量采用T分数，所述T分数的计算步骤和定义为：首先批阅被试的试卷，获得每道阅读理解问题所有被试的原始平均分；接着将上述每个原始平均分转化为百分数，公式是：百分数＝原始平均分/满分值×100％；所述满分值为对应该原始平均...

【专利技术属性】
技术研发人员：罗德红，龚婧，李奕霏，王梦欣，
申请(专利权)人：广西大学，
类型：发明
国别省市：广西,45

全部详细技术资料下载我是这个专利的主人