基于议论文篇章结构的评价方法及装置制造方法及图纸

技术编号:19056837 阅读:96 留言:0更新日期:2018-09-29 12:10
本发明专利技术公开了一种基于议论文篇章结构的评价方法及装置,其中,方法包括以下步骤:通过待评价议论文的段落类型和句子类型获取待评价议论文的多个语篇要素;通过多个语篇要素构建文章篇章结构的序列式特征、平面式特征或层次式特征;根据文章篇章结构的序列式特征、平面式特征或层次式特征通过预设的序列式特征模型、平面式特征模型或层次式特征模型得到待评价议论文的评价结果。该方法可以根据文章篇章结构的序列式特征、平面式特征或层次式特征通过预设的序列式特征模型、平面式特征模型或层次式特征模型得到待评价议论文的评价结果,有效提高评价的准确度。

【技术实现步骤摘要】
基于议论文篇章结构的评价方法及装置
本专利技术涉及自然语言处理
,特别涉及一种基于议论文篇章结构的评价方法及装置。
技术介绍
议论文是一种常见的文章题材形式,是一种剖析事物、论述事理、发表意见、提出主张的文体。议论文通常是是对某个问题或某件事进行分析、评论,表明自己的观点、立场、态度、看法和主张。议论文三要素是论点、论据、论证。一般来说议论文的结构通常都是比较固定的,如总分式、对照式、递进式、并列式。因此识别议论文的结构有助于提高对议论文的理解和文章质量的评估,对文章打分系统起到促进作用。相关技术中是基于文章的连贯性、语法质量、主题相关性的研究,对文章篇章结构的研究相对较少。在二十世纪初,已经有了自动评价的方法研究。如IEA(智能论文评估,IntelligentEssayAssessor),e-Rater等。除此之外,还有一些非商业用途的自动评价系统,如基于语义相关性的自动评价系统,以及句子即时关联对文章评分的影响。早期的文章自动评价模型大多使用的分类器是逻辑回归,这种简单高效的模型能够很方便的映射文章特征到对应的分数。近年来关于文章自动评价的模型开始使用较为复杂的模型结果来更多的获取文章特征信息,通常会获得更好的文章评分结果。相关技术使用语言、语义和修辞特征构建层次分类模型进行文章评价。相关技术有的使用基于意见表达和主题元素的特征构建改进后的逻辑回归、线性回归模型。相关技术还研究了基于文章篇章结构的支持向量机分类模型。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种基于议论文篇章结构的评价方法,该方法可以有效提高评价的准确度。本专利技术的另一个目的在于提出一种基于议论文篇章结构的评价装置。为达到上述目的,本专利技术一方面实施例提出了一种基于议论文篇章结构的评价方法,包括以下步骤:通过待评价议论文的段落类型和句子类型获取所述待评价议论文的多个语篇要素;通过所述多个语篇要素构建文章篇章结构的序列式特征、平面式特征或层次式特征;根据所述文章篇章结构的序列式特征、平面式特征或层次式特征通过预设的序列式特征模型、平面式特征模型或层次式特征模型得到所述待评价议论文的评价结果。本专利技术实施例的基于议论文篇章结构的评价方法,通过对议论文构建有效的篇章结构表示方法,分别对议论文篇章特征采用序列式、平面式、层次式的表示方法,然后针对不同种类型的篇章结构特征表示方法构建神经网络模型进行篇章结构自动评价,有效提高评价的准确度。另外,根据本专利技术上述实施例的基于议论文篇章结构的评价方法还可以具有以下附加的技术特征:进一步地,在本专利技术的一个实施例中,还包括:将句子的篇章要素填充到议论文的对应部分,且对应空缺部分填充0,以将每篇文章表示为预设维度的向量,得到文章的序列式特征;根据所述文章的序列式特征构建分类器建模,其中,采用SVM(SupportVectorMachine,支持向量机)进行模型分类,以得到所述预设的序列式特征模型。进一步地,在本专利技术的一个实施例中,还包括:将每个段落中预设的句子组成一个向量,再将预设的段落组成一个矩阵,且对应空缺部分填充0,以将每篇文章表示为预设的矩阵,得到文章的序列式特征;根据所述文章的平面式特征和所述文章篇章结构分数进行建模,其中,采用卷积神经网络进行建模,以得到所述预设的平面式特征模型。进一步地,在本专利技术的一个实施例中,还包括:将每个段落中预设的句子组成一个向量,再将预设的段落组成一个矩阵,且对应空缺部分填充0,以将每篇文章表示为预设的矩阵,得到文章的层次式特征;根据所述对文章的层次式特征和所述文章篇章结构分数进行建,其中,采用层次神经网络进行建模,并通过GRU(GatedRecurrentUnit,GRU神经网络)来获取所述文章的段落级信息,通过LSTM(LongShort-TermMemory,长短期记忆网络)网络层获取所述文章的句子之间的前后连接关系,得到所述预设的层次式特征模型。进一步地,在本专利技术的一个实施例中,所述语篇要素包括引言、论点、例子、观点、注重和结论中的一种。为达到上述目的,本专利技术另一方面实施例提出了一种基于议论文篇章结构的评价装置,包括:第一获取模块,用于通过待评价议论文的段落类型和句子类型获取所述待评价议论文的多个语篇要素;第一构建模块,用于通过所述多个语篇要素构建文章篇章结构的序列式特征、平面式特征或层次式特征;评价模块,用于根据所述文章篇章结构的序列式特征、平面式特征或层次式特征通过预设的序列式特征模型、平面式特征模型或层次式特征模型得到所述待评价议论文的评价结果。本专利技术实施例的基于议论文篇章结构的评价装置,通过对议论文构建有效的篇章结构表示方法,分别对议论文篇章特征采用序列式、平面式、层次式的表示方法,然后针对不同种类型的篇章结构特征表示方法构建神经网络模型进行篇章结构自动评价,有效提高评价的准确度。另外,根据本专利技术上述实施例的基于议论文篇章结构的评价装置还可以具有以下附加的技术特征:进一步地,在本专利技术的一个实施例中,还包括:第二获取模块,用于将句子的篇章要素填充到议论文的对应部分,且对应空缺部分填充0,以将每篇文章表示为预设维度的向量,得到文章的序列式特征;第二构建模块,用于根据所述文章的序列式特征构建分类器建模,其中,采用SVM进行模型分类,以得到所述预设的序列式特征模型。进一步地,在本专利技术的一个实施例中,还包括:第三获取模块,用于将每个段落中预设的句子组成一个向量,再将预设的段落组成一个矩阵,且对应空缺部分填充0,以将每篇文章表示为预设的矩阵,得到文章的序列式特征;第三构建模块,用于根据所述文章的平面式特征和所述文章篇章结构分数进行建模,其中,采用卷积神经网络进行建模,以得到所述预设的平面式特征模型。进一步地,在本专利技术的一个实施例中,还包括:第四获取模块,用于将每个段落中预设的句子组成一个向量,再将预设的段落组成一个矩阵,且对应空缺部分填充0,以将每篇文章表示为预设的矩阵,得到文章的层次式特征;第四构建模块,用于根据所述对文章的层次式特征和所述文章篇章结构分数进行建,其中,采用层次神经网络进行建模,并通过GRU来获取所述文章的段落级信息,通过LSTM网络层获取所述文章的句子之间的前后连接关系,得到所述预设的层次式特征模型。进一步地,在本专利技术的一个实施例中,所述语篇要素包括引言、论点、例子、观点、注重和结论中的一种。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术实施例的基于议论文篇章结构的评价方法的流程图;图2为根据本专利技术一个实施例的基于议论文篇章结构的评价方法的流程图;图3为根据本专利技术一个实施例的平面式特征卷积神经网络模型示意图;图4为根据本专利技术一个实施例的平面式特征卷积神经网络模型示意图;图5为根据本专利技术实施例的基于议论文篇章结构的评价的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例本文档来自技高网...

【技术保护点】
1.一种基于议论文篇章结构的评价方法,其特征在于,包括以下步骤:通过待评价议论文的段落类型和句子类型获取所述待评价议论文的多个语篇要素;通过所述多个语篇要素构建文章篇章结构的序列式特征、平面式特征或层次式特征;以及根据所述文章篇章结构的序列式特征、平面式特征或层次式特征通过预设的序列式特征模型、平面式特征模型或层次式特征模型得到所述待评价议论文的评价结果。

【技术特征摘要】
1.一种基于议论文篇章结构的评价方法,其特征在于,包括以下步骤:通过待评价议论文的段落类型和句子类型获取所述待评价议论文的多个语篇要素;通过所述多个语篇要素构建文章篇章结构的序列式特征、平面式特征或层次式特征;以及根据所述文章篇章结构的序列式特征、平面式特征或层次式特征通过预设的序列式特征模型、平面式特征模型或层次式特征模型得到所述待评价议论文的评价结果。2.根据权利要求1所述的基于议论文篇章结构的评价方法,其特征在于,还包括:将句子的篇章要素填充到议论文的对应部分,且对应空缺部分填充0,以将每篇文章表示为预设维度的向量,得到文章的序列式特征;根据所述文章的序列式特征构建分类器建模,其中,采用SVM进行模型分类,以得到所述预设的序列式特征模型。3.根据权利要求1所述的基于议论文篇章结构的评价方法,其特征在于,还包括:将每个段落中预设的句子组成一个向量,再将预设的段落组成一个矩阵,且对应空缺部分填充0,以将每篇文章表示为预设的矩阵,得到文章的序列式特征;根据所述文章的平面式特征和所述文章篇章结构分数进行建模,其中,采用卷积神经网络进行建模,以得到所述预设的平面式特征模型。4.根据权利要求1所述的基于议论文篇章结构的评价方法,其特征在于,还包括:将每个段落中预设的句子组成一个向量,再将预设的段落组成一个矩阵,且对应空缺部分填充0,以将每篇文章表示为预设的矩阵,得到文章的层次式特征;根据所述对文章的层次式特征和所述文章篇章结构分数进行建,其中,采用层次神经网络进行建模,并通过GRU来获取所述文章的段落级信息,通过LSTM网络层获取所述文章的句子之间的前后连接关系,得到所述预设的层次式特征模型。5.根据权利要求1-4任一项所述的基于议论文篇章结构的评价方法,其特征在于,所述语篇要素包括引言、论点、例子、观点、注重和结论中的一种。6.一种基于议论文篇章结构的评价装置,其特征在于,包括:第一获取模块,用于通...

【专利技术属性】
技术研发人员:宋巍李明扬刘丽珍
申请(专利权)人:首都师范大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1