本发明专利技术提供一种汉语口头作文计算机辅助评分方法,包括:收集各个考生口语作文作答音频;对各个考生的作答音频进行解码,获取学生的口头作文文本信息;对获取的口头作文文本信息进行人工修正,获取较为精确的学生口头作文文本信息;对待评分口头作文进行词条总数分析,获取归一化的词条统计参数;对待评分口头作文中断比例参数的特征分析,获取归一化的中断比例参数;对待评分口头作文均匀分布参数的特征分析,获取归一化的均匀分布参数;对获取的词条统计参数、中断比例参数、均匀分布参数分别赋予相应权值并求和。本发明专利技术提供的汉语口头作文计算机辅助评分方法为教师制定目标、组织教学和有效评价等方面提供了依据。
【技术实现步骤摘要】
一种汉语口头作文计算机辅助评分方法
本专利技术涉及汉语口头作文的自动评分
,特别涉及一种汉语口头作文计算机辅助评分方法。
技术介绍
个体差异,也称个别差异、个性差异,是指“个人在认识、情感、意志等心理活动过程中表现出来的相对稳定而又不同于他人的心理、生理特点”。它表现在“质和量两个方面”,“质的差异指心理生理特点的不同及行为方式上的不同,量的差异指发展速度的快慢和发展水平的高低”。对个体差异最早进行研究的是我国古代伟大的思想家、教育家孔子。早在2000多年前,孔子就积极倡导并十分重视因材施教。“因材施教”是我国古代就提出的一种处理教学中的个体差异的教学原则和教学策略。近代布鲁姆也认为教育教学必须考虑学生作为人的特性,其中个体差异是一个重要的方面。我们知道教育教学活动应是以人的发展为中心的活动。在以班级为组织形式的教学中,同一班级中的不同学生个体之间存在着诸多方面的差异,个体差异不可避免地成为影响教学活动的重要因素之一。以口头作文为例,从宏观的角度,我们知道学生的身心发展在一定年龄阶段上具有一定的稳定性和普遍性,于是我们对语料库中的两类主题(“名著导读”、“关注生活”)从整体上进行词频统计,各列出了前100的词,并对高频词进行分组分类,筛选出四类口头作文词汇中的典型词进行分析,从而了解本班口头作文的总体状况。但由于每个人的素质、环境和所受教育的影响不同,以及主观努力等诸方面的差异,特别是在口头作文训练中,不同学生的口头作文水平存在很大的差异,即便是同一个学生在不同主题下的水平也会存在波动。所以如果想更具体深入的了解学生在口头作文中是“怎么说”的,就有必要关注个体的差异。在口头作文中进行的个体差异的词频研究,就是将词频的统计和分析具体到每一个学生,每一次口头作文的训练中来。通过不同方法下的词频分析,对口头作文中的个体差异进行测量,以期获得更有效的口头作文的教学方法。换言之,个体差异的研究便于教师能了解和把握学生的个性特点、口头作文的能力等方面的差异,为教师制定目标、组织教学和有效评价等方面提供了依据。因此,有必要提供一种汉语口头作文计算机辅助评分方法,以便于对个体差异的研究便于教师能了解和把握学生的个性特点、口头作文的能力等方面的差异,为教师制定目标、组织教学和有效评价等方面提供了依据。
技术实现思路
为了克服上述已有技术存在的不足,本专利技术的目的旨在提供一种汉语口头作文计算机辅助评分方法,该方法对个体差异的研究便于教师能了解和把握学生的个性特点、口头作文的能力等方面的差异,为教师制定目标、组织教学和有效评价等方面提供了依据。为实现本专利技术目的,提供一种汉语口头作文计算机辅助评分方法,包括以下步骤:通过录音设备,收集各个考生口语作文作答音频;通过音频转码软件,对各个考生的作答音频进行解码,获取学生的口头作文文本信息;对获取的口头作文文本信息进行人工修正;对待评分口头作文进行词条总数分析,获取归一化的词条统计参数;对待评分口头作文中断比例参数的特征分析,获取归一化的中断比例参数;对待评分口头作文均匀分布参数的特征分析,获取归一化的均匀分布参数;对获取的词条统计参数,中断比例参数,均匀分布参数,分别赋予相应权值并求和后获得所述待评分口头作文的最终评分结果。进一步地,所述的词条总数的计算公式如下:词条总数=语料总数-标点、数字及字符的统计的统计总数进一步地,所述的归一化词条统计参数的计算公式如下:其中:i是待评分口头作文样本的序号,Xi是第i号语料的作文词条总数,Xmax是所有待评价语料样本中词条总数的最大值。其中,归一化词条统计参数的值在[0,1]之间,值越高者视为语言越丰富。进一步地,所述的中断次数指具体统计词频表中选择出的表示语流中断的代表性的字、词的次数,如:“嗯”、“呃”、“然后”等的次数。进一步地,在中断统计中,语流中断选择代表性的字、词,若选择出的字、词在文中表示承接关系,如“嗯”、“呃”、“然后”等词在文中若表示承接关系,则不应视作语流的中断,应从总的语言停顿统计中提出。进一步地,所述的中断比例参数的计算公式如下:进一步地,所述的归一化中断比例参数的计算公式如下:其中:中断比例i是第i号语料的中断比例值,中断比例min是所有待评价语料样本中中断比例的最小值。其中,归一化后中断比例参数的值在[0,1]之间,值越高者视为语流越流畅,语言质量越高。进一步地,所述的均匀分布参数的计算公式如下:其中:S”定义为均匀分布参数;xi定义为第i组出现主题词的个数;为每一个作文样本在作文中主题词分布的平均值;N定义为主题词的组数。进一步地,所述的归一化的均匀分布参数的计算公式如下:其中,S”为第i号语料的均匀分布参数值;S”min为所有待评价语料样本中均匀分布参数的最小值。其中,归一化均匀分布参数的值越高者视为主题越明确。进一步地,所述的待评分口头作文分数权重计算时依赖词条统计参数、中断比例参数和均匀分布参数。权重可通过经验设定或通过自适应的反馈算法确定。进一步地,作为本专利技术的一种优选方案,设定:词条统计在得分中所占比重是30%;中断比例分析在得分中所占比重是30%;均匀参数分析在得分中所占比重是40%,本专利技术规定的待评分作文机器得分计算公式如下:综合得分=100*(权重1*词条统计参数+权重2*中断比例参数+权重3*均匀分布参数)其中:权重1=30%,权重=30%,权重3=40%。进一步地,作为本专利技术的一种优选方案,得分设定为5个等级。设定:机器得分的前5%记为A+,20%-5%记为A,25%-20%记为B+,40%-25%记为B,70%-40%记为C,后30%记为D。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:本专利技术可以科学地提高中小学语文教师批阅学生口头作文的效率以及减轻其工作量,具有较好的评分信度和效度。本专利技术在词频统计分析的基础上,创造性地设计出辅助评价口头作文水平的三个参数,并通过比较分析来深入研究个体差异。个体差异的研究便于教师能了解和把握学生的个性特点、口头作文的能力等方面的差异,为教师制定目标、组织教学和有效评价等方面提供了依据。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明图1示出了根据本专利技术技术方案的一种汉语口头作文计算机辅助评分方法的具体流程示意图。具体实施方式下面详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解的是,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项本文档来自技高网...

【技术保护点】
一种汉语口头作文计算机辅助评分方法,其特征在于,包括以下步骤:通过录音设备,收集各个考生口语作文作答音频;通过音频转码软件,对各个考生的作答音频进行解码,获取学生的口头作文文本信息;对获取的口头作文文本信息进行人工修正,获取修正后的学生口头作文文本信息;对待评分口头作文进行词条总数分析和归一化处理,获取归一化的词条统计参数;对待评分口头作文中断比例参数的特征分析和归一化处理,获取归一化的中断比例参数;对待评分口头作文均匀分布参数的特征分析和归一化处理,获取归一化的均匀分布参数;对获取的词条统计参数、中断比例参数、均匀分布参数,分别赋予相应权值并求和后获得所述待评分口头作文的最终评分结果。
【技术特征摘要】
1.一种汉语口头作文计算机辅助评分方法,其特征在于,包括以下步骤:通过录音设备,收集各个考生口语作文作答音频;通过音频转码软件,对各个考生的作答音频进行解码,获取学生的口头作文文本信息;对获取的口头作文文本信息进行人工修正,获取较为精确的学生口头作文文本信息;对待评分口头作文进行词条总数分析,获取归一化的词条统计参数;对待评分口头作文中断比例参数的特征分析,获取归一化的中断比例参数;对待评分口头作文均匀分布参数的特征分析,获取归一化的均匀分布参数;对获取的词条统计参数、中断比例参数、均匀分布参数,分别赋予相应权值并求和后获得所述待评分口头作文的最终评分结果;其中:所述的归一化词条统计参数的计算公式如下:其中:i是待评分口头作文样本的序号,Xi是第i号语料的作文词条总数,Xmax是所有待评价语料样本中词条总数的最大值;其中,归一化词条统计参数的值在[0,1]之间;所述的中断比例参数的计算公式如下:所述的归一化中断比例参数的计算公式如下:其中:中断比例i是第i号语料的中断比例值,中断比例min是所有待评价语料样本中中断比例的最小值;其中:归一化后中断比例参数的值在[0,1]之间,值越高者视为语流越流畅,语言质量越高;所述的均匀分布参数的计算公式如下:
【专利技术属性】
技术研发人员:张益昕,张旭苹,唐志强,王园园,李葆嘉,
申请(专利权)人:南京大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。