一种针对小学生作文辅导的作文要素分析算法制造技术

技术编号:22076145 阅读:34 留言:0更新日期:2019-09-12 14:16
本发明专利技术创造属于教学辅导领域,具体涉及了一种针对小学生作文辅导的作文要素分析算法。为了解决存在小学生作文写作难的问题,本发明专利技术创造提出了一种可以高效、明了并轻松的提升小学生作文写作水平的针对小学生作文辅导的作文要素分析算法。为了实现上诉目的,本发明专利技术创造所用采用的技术方案是,一种针对小学生作文辅导的作文要素分析算法,包括以下步骤:S1:初始化;S2:录入需分析的作文;S3:对作文做结构分段处理;S4:对作文做写作要素点提取和分析;S5:给出作文分析结果。

A Composition Element Analysis Algorithms for Primary School Students'Composition Counseling

【技术实现步骤摘要】
一种针对小学生作文辅导的作文要素分析算法
本专利技术创造属于教学辅导领域,具体涉及了一种针对小学生作文辅导的作文要素分析算法。
技术介绍
语文学习中会写作文的重要性,是众所周知的。它对语文和其他学科高效的学习,都有基础性的作用。但现实是:中国九成的中小学生都害怕写作文,不喜欢写作文,作文成绩总是让人揪心。如此,作文,成了中国亿万家长和学生心中永远的痛。家长痛点:(1)九成的家长在学生时代就害怕作文,不会写作文,所以没有信心与能力指导孩子的写作。极少部分家长,自己写作能力还可以,但如何指导不同学习阶段的孩子,写出符合不断学习阶段要求的作文,也是一筹莫展。(2)家长们听说:要想作文好,孩子就要多读书、多写。但不久后,他们就会绝望地发现,孩子喜欢看书、读了很多书,作文能力没有提高;写了很多,孩子的作文还是写得很不理想,测试中得分也不搞。(3)送孩子去作文培训机构,效果也不是很明显。个别写作方法会了,但整体作文能力还是差强人意。与之相随,学生写作文的痛点是:(1)不想写什么内容。(2)不熟练写作方法。(3)没有写作的信心,所以厌恶和恐惧写作文。那作文学习为什么会出现如此巨大的痛点呢?那还是因为我国中小学语文教学最大的难题是:整个小学阶段和中学阶段的作文训练点不成体系,没有操作性的系统。相应,每次的习作训练点也就不具有足够的操作性与实效。
技术实现思路
为了解决上述存在小学生作文写作难的问题,本专利技术创造提出了一种可以高效、明了并轻松的提升小学生作文写作水平的针对小学生作文辅导的作文要素分析算法。为了实现上诉目的,本专利技术创造所用采用的技术方案是,一种针对小学生作文辅导的作文要素分析算法,包括以下步骤:S1:初始化;S2:录入需分析的作文;S3:对作文做结构分段处理;S4:对作文做写作要素点提取和分析;S5:给出作文分析结果。作为优选,所述的S3包括以下步骤:A1:将作文按命题进行层次化分类,为每类作文都精心设计结构组成部分;A2:根据大量的范文标注和数据分析,建立文本分段和标注的数据模型;A3:采用机器学习的算法,将学生习作作文进行自动的分段结构分析。作为优选,所述的A3包括:B1:基于输入文本的自然标点信息进行初步分割,根据文本中的回车换行符、句号以及表示句子结束的叹号问号等,将文本分割成一组句子级别的单元,简称句单元;B2:对每个句单元文本,进行各自的语义分析,包括语法分析和词法分析,提取出关键成分比如主语,命名实体,谓词等;B3:运用文本主题模型和文本自动摘要技术,为每个句单元提取标注一些关键词;B4:将句单元聚类,形成段落;B5:将聚类形成的段落进行标注,判定此段落是否属于某类作文。作为优选,所述B4中聚类的依据为:一是直接计算各个句单元对直接的文本相似度,二是根据上一步骤每个句单元提取处理的关键成分以及关键词摘要来计算,同时也结合每个句单元的字数长度等基础信息。作为优选,所述的S4包括一下步骤:C1:建立了形容词,副词,动词的词典,词汇选取上侧重小学语文教学大纲涵盖的范围;C2:引入自然语言处理学术领域上经典的语料数据,配合互联网上海量文本数据和社交网络丰富的资源,建立了一个针对小学生作文领域的词汇ontology(本体库);C3:构建一个3层的神经网络,含有一个输入层,一个隐含层,和一个输出层;C4:通过对已标注作文数据的分析处理,对于一个要素点,提取出包含的所有关键词,根据词语本体库,对这些关键词进行聚类,并记录词的类别分布和权重;C5:遇到新的待分析的作文时,将文本分词,然后逐个词语进行计算对比,如果和某个要素点的关键词类别分布接近,列入候选,最后计算各个候选的归一化得分,排序后,输出概率最高的候选项,即为这段作文可能包含的要素点;C6:建立一个专家系统,通过标注数据来设计一个规则模板组成决策流程;C7:依照决策流程依次判决,最终得到目标的要素点;C8:将原文中含有相对应要素的句子和相应的关键词汇,进行高亮显示。作为优选,所述的专家系统的构建方法:D1:搜集大量的,各个年级小学生的范文和真实作文作业,请有经验的教研老师进行了标注,即将作文中含有的写作要素点标注出来,并且给出对应的文字范围,以及重要的关键词和词组特征;D2:定义一整套的文本特征单元,从细到粗,分为:字,词,词组,短语(如主谓,动宾),子句(逗号等分隔的),分句,从句,整句,句群,段落,章节,篇章;D3:在各级别单元上,分别可以定义一系列的规则和模式,以类文法语言描述。作为优选,所述的C3中的神经网络中输入层输入的为一段上下文环境的文本片段,输出层引入softmax函数来预测此段上下文的中心词的概率;输入层到隐藏层的神经网络参数即为每个词的嵌入表达,亦可成为词向量,是一个200维的浮点数向量;得到词向量之后,任意两个词的语义关系,可简单理解为近义程度,可以通过两个词的词向量计算所得(最简单方法为词向量做内积);反之,给定一个词,我们可以搜索计算它的同义词。作为优选,所述的神经网络的构建方法为:首先,构建机器学习算法框架中需要的训练集,验证集和测试集;将标注的作文文本,格式化成神经网络的输入数据,即将已经标注出要素集合,作为各段文本的多类标签;采用多层的循环神经网络(RNN)来构建模型;在隐藏层,引入了双向长短时记忆单元(Bi-LSTM)。本专利技术创造的有益效果:(1)结构分段处理。深度结合小学作文教学大纲要求,将作文按命题进行层次化分类,为每类作文都精心设计结构组成部分。再根据大量的范文标注和数据分析,建立文本分段和标注的数据模型。(2)采用机器学习的算法,将学生习作作文进行自动的分段结构分析。(3)分段之后,为下一步基于段落的要素点分析和评价建立了基础。基于段落的作文分析,比基于整篇的分析方法,更加具体直观,小学生和家长都更易于理解。(4)写作要素点提取和分析:在已知年级范围,作文主题类别后,再判定当前段落结构,就可以分段进行要素点提取。(5)通过基于关键词规则模板库和文本大数据的专家系统,分析出一段文字中含有的要素点,比如从“眼睛圆圆的像个灯泡”中检查出“比喻”这个要素点。(6)此要素点为“状物-动物”类命题作文中“外形特点”段落的基础要素,这句话采用“比喻”要素点的力度为“中等”。(7)根据这个算法的输出结果,在作文辅导的交互界面上,用户点选“比喻”这个要素点,能够将原文中含有此要素的句子,和相应的关键模式,进行高亮显示;清晰的像学生和家长指明,这段话写的是否好,好在哪里;如果缺失某个基础要素,也会给出提示,给下一步的写作改进指明方向。(8)基于这两步关键算法,配合作文辅导交互系统的用户界面,可以高效的完成对整篇作文的辅导和点评。附图说明图1:要素分析算法原理图具体实施方式一种针对小学生作文辅导的作文要素分析算法,包括以下步骤:S1:初始化;S2:录入需分析的作文;S3:对作文做结构分段处理;S4:对作文做写作要素点提取和分析;S5:给出作文分析结果。作为优选,所述的S3包括以下步骤:A1:将作文按命题进行层次化分类,为每类作文都精心设计结构组成部分;A2:根据大量的范文标注和数据分析,建立文本分段和标注的数据模型;A3:采用机器学习的算法,将学生习作作文进行自动的分段结构分析。作为优选,所述的A3包括:B1:基于输入文本的本文档来自技高网...

【技术保护点】
1.一种针对小学生作文辅导的作文要素分析算法,其特征在于,包括以下步骤:S1:初始化;S2:录入需分析的作文;S3:对作文做结构分段处理;S4:对作文做写作要素点提取和分析;S5:给出作文分析结果。

【技术特征摘要】
1.一种针对小学生作文辅导的作文要素分析算法,其特征在于,包括以下步骤:S1:初始化;S2:录入需分析的作文;S3:对作文做结构分段处理;S4:对作文做写作要素点提取和分析;S5:给出作文分析结果。2.根据权利要求1所述的一种针对小学生作文辅导的作文要素分析算法,其特征在于,所述的S3包括以下步骤:A1:将作文按命题进行层次化分类,为每类作文都精心设计结构组成部分;A2:根据大量的范文标注和数据分析,建立文本分段和标注的数据模型;A3:采用机器学习的算法,将学生习作作文进行自动的分段结构分析。3.根据权利要求2所述的一种针对小学生作文辅导的作文要素分析算法,其特征在于,所述的A3包括:B1:基于输入文本的自然标点信息进行初步分割,根据文本中的回车换行符、句号以及表示句子结束的叹号问号等,将文本分割成一组句子级别的单元,简称句单元;B2:对每个句单元文本,进行各自的语义分析,包括语法分析和词法分析,提取出关键成分比如主语,命名实体,谓词等;B3:运用文本主题模型和文本自动摘要技术,为每个句单元提取标注一些关键词;B4:将句单元聚类,形成段落;B5:将聚类形成的段落进行标注,判定此段落是否属于某类作文。4.根据权利要去3所述的一种针对小学生作文辅导的作文要素分析算法,其特征在于,所述B4中聚类的依据为:一是直接计算各个句单元对直接的文本相似度,二是根据上一步骤每个句单元提取处理的关键成分以及关键词摘要来计算,同时也结合每个句单元的字数长度等基础信息。5.根据权利要求1所述的一种针对小学生作文辅导的作文要素分析算法,其特征在于,所述的S4包括一下步骤:C1:建立了形容词,副词,动词的词典,词汇选取上侧重小学语文教学大纲涵盖的范围;C2:引入自然语言处理学术领域上经典的语料数据,配合互联网上海量文本数据和社交网络丰富的资源,建立了一个针对小学生作文领域的词汇ontology(本体库);C3:构建一个3层的神经网络,含有一个输入层,一个隐含层,和一个输出层;C4:通过对已标注作文数据的分析处理,对于一个要素点,提取出包含的所有关键词,根...

【专利技术属性】
技术研发人员:赖伟周昌伟吴义坚
申请(专利权)人:上海元趣信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1