一种用于对英语作文进行打分的方法以及装置制造方法及图纸

技术编号:12581110 阅读:70 留言:0更新日期:2015-12-23 19:26
本发明专利技术涉及自动打分领域,公开了一种用于对英语作文进行打分的方法以及装置。其中,所述方法包括:获取待打分英语作文,并分离出所述待打分英语作文中的句子;将所述待打分英语作文中的每个句子与预设的语言模型进行匹配,并计算所述每个句子与所述语言模型的匹配程度;以及根据所述每个句子与所述语言模型的匹配程度对所述待打分英语作文进行打分。本发明专利技术通过引入语言模型,解决了作文语料中未出现题目或自拟题目的作文的打分问题。

【技术实现步骤摘要】

本专利技术涉及自动打分领域,具体地,涉及一种用于对英语作文进行打分的方法以及装置
技术介绍
英语作文自动打分中,现有技术基本都是预先知道了作文题目,对限定了作文题目的作文进行自动打分。对限定了作文题目的作文进行自动打分主要是通过将该限定作文题目的作文与收集的语料中相同题目的模板作文进行比较,从局部的用词和全局的布局两方面进行考虑。这样的方法在限定作文题目的前提下,可以达到和人工打分基本一致的结果,例如批改网(www.piga1.com)。然而,现有技术方法需要采集大量的给定题目的且处于不同层次的作文语料,消耗大量的人力和时间。此外,现有技术方法不能处理自拟题目的英语作文的自动打分问题。
技术实现思路
本专利技术的目的是提供一种用于对英语作文进行打分的方法以及装置。其中,所述方法通过引入语言模型,解决了作文语料中未出现题目或自拟题目的作文的打分问题。为了实现上述目的,本专利技术提供一种用于对英语作文进行打分的方法。所述方法包括:获取待打分英语作文,并分离出所述待打分英语作文中的句子;将所述待打分英语作文中的每个句子与预设的语言模型进行匹配,并计算所述每个句子与所述语言模型的匹配程度;以及根据所述每个句子与所述语言模型的匹配程度对所述待打分英语作文进行打分。优选地,在获取待打分英语作文,并分离出所述待打分英语作文中的句子之前,所述方法还包括:采集文章语料;以及根据所采集的文章语料对隐马尔科夫模型进行训练,以获得预设的语言模型。优选地,根据所采集的文章语料使用机器学习的训练方式通过循环神经网络的训练架构对隐马尔科夫模型进行训练,以获得预设的语言模型。优选地,所述匹配程度通过句子在所述语言模型中出现的概率进行表征,根据以下的公式计算句子在所述语言模型中出现的概率:P (W1W2W3…wn) = P (W1) P (W11 w2) P (w21 w3)...P (wn j | wn)其中,P(W1W2WfWn)为句子在所述语言模型中出现的概率,Wn为句子的第η个单词,P (W1)为句子的第一个单词在所述语言模型中出现的概率,P (wnl I wn)为句子的第n-Ι个单词和第η个单词所组成的单词对在所述语言模型中出现的概率。优选地,根据所述句子与所述语言模型的匹配程度确定所述句子的分数,并根据所述句子的分数计算平均分,从而得到所述待打分英语作文的分数。相应地,本专利技术还提供一种用于对英语作文进行打分的装置。所述装置包括:获取分离单元,用于获取待打分英语作文,并分离出所述待打分英语作文中的句子;模型匹配单元,用于将所述待打分英语作文中的每个句子与预设的语言模型进行匹配,并计算所述每个句子与所述语言模型的匹配程度;以及作文打分单元,用于根据所述每个句子与所述语言模型的匹配程度对所述待打分英语作文进行打分。优选地,所述装置还包括:模型构建单元,用于在所述获取分离单元获取待打分英语作文,并分离出所述待打分英语作文中的句子之前,采集文章语料,并根据所采集的文章语料对隐马尔科夫模型进行训练,以获得预设的语言模型。优选地,所述模型构建单元根据所采集的文章语料使用机器学习的训练方式通过循环神经网络的训练架构对隐马尔科夫模型进行训练,以获得预设的语言模型。优选地,所述匹配程度通过句子在所述语言模型中出现的概率进行表征,所述模型匹配单元根据以下的公式计算句子在所述语言模型中出现的概率:P (W1W2W3…wn) = P (W1) P (W11 w2) P (w21 w3)...P (wn j | wn)其中,P(W1W2WfWn)为句子在所述语言模型中出现的概率,Wn为句子的第η个单词,P (W1)为句子的第一个单词在所述语言模型中出现的概率,P (wnl I wn)为句子的第n-Ι个单词和第η个单词所组成的单词对在所述语言模型中出现的概率。优选地,所述作文打分单元根据所述句子与所述语言模型的匹配程度确定所述句子的分数,并根据所述句子的分数计算平均分,从而得到所述待打分英语作文的分数。通过上述技术方案,使用机器学习的训练方式对所采集的文章语料进行训练以得到语言模型,并将从待打分英语作文中分离的句子与语言模型进行匹配以及根据每个句子与语言模型的匹配程度对英语作文进行打分,解决了作文语料中未出现题目或自拟题目的作文的打分问题。【附图说明】图1是本专利技术提供的用于对英语作文进行打分的方法的流程图;以及图2是本专利技术提供的用于对英语作文进行打分的装置的结构示意图。附图标记说明10获取分离单元20模型匹配单元30作文打分单元40模型构建单元【具体实施方式】以下结合附图对本专利技术的【具体实施方式】进行详细说明。应当理解的是,此处所描述的【具体实施方式】仅用于说明和解释本专利技术,并不用于限制本专利技术。在英语作文自动打分中,现有技术基本都是预先知道了作文题目,对限定了作文题目的作文进行自动打分。对限定了作文题目的作文进行自动打分主要是通过将该限定作文题目的作文与收集的语料中相同题目的模板作文进行比较,从局部的用词和全局的布局两方面进行考虑。然而,现有技术方法不能处理自拟题目的英语作文的自动打分问题。因此,本专利技术特提供一种用于对英语作文进行打分的方法。为了解决现有技术中所存在的问题,本专利技术引入了语言模型的概念和方法。下面对语言模型进行详细地介绍:英语作文是由一个个句子组成的,而句子是由一个个单词组成的。单词的组合方式(包括顺序和搭配)会影响句子的流畅度和优美度。用符号和公式表达如下,用W1W2W^Wn表示一个由η个单词组成的句子,这η个单词分别是W1, W2, W3,…,Wn。这个句子出现的概率用P(W1W2WfWn)表示,我们假定单词之间的出现关系具有隐马尔科夫模型(Hidden MarkovModel)特性,也即句子中一个单词W1的出现只和它紧邻的前一个单词W1 i的出现有关系,而和它前面以往的单词(Wi2wi3...)的出现无关。那么这个句子出现的概率P(W1W2WyWn)=P (W1) P (W1 I W2) P (W2 I W3)…P (Wn ! I Wn),说明了句子出现的概率和其中“单词对”出现的概率有关。对于未出现作文题目或自拟作文题目的英语作文,预先是没有范文的,因此,通过和范文比较的打分方式在此行不通,而要直接对英语作文本身进行打分。图1是本专利技术提供的用于对英语作文进行打分的方法的流程图。如图1所示,本专利技术提供的用于对英语作文进行打分的方法包括:在步骤SlOl中,采集文章语料。具体地,采集优秀的文章语料。所述优秀的文章语料来自于中国日报和华尔街日报。一般来说,由优秀文章语料进行训练得到语言模型,所需语料文本的大小在2.5G以上。在步骤S102中,根据所采集的文章语料对隐马尔科夫模型进行训练,以获得预设的语言模型。一般来说,根据所采集的文章语料使用机器学习的训练方式通过循环神经网络的训练架构(http://rnnlm.0rg/)对隐马尔科夫模型进行训练,以获得预设的语言模型。训练得到的语言模型采用单词对的形式。利用符号和公式表达,训练可得到所有的单词对在所述语言模型中出现的概率P (W11 W])。其中,wjP w ,为遍历整个语料文本所包含的英语单词,语料中未出现的单词对采用平滑处理。在步骤S103中,获取待打分英语作文,并分离本文档来自技高网...

【技术保护点】
一种用于对英语作文进行打分的方法,其特征在于,所述方法包括:获取待打分英语作文,并分离出所述待打分英语作文中的句子;将所述待打分英语作文中的每个句子与预设的语言模型进行匹配,并计算所述每个句子与所述语言模型的匹配程度;以及根据所述每个句子与所述语言模型的匹配程度对所述待打分英语作文进行打分。

【技术特征摘要】

【专利技术属性】
技术研发人员:唐聪宋文略杨晓昊许轶肖迪
申请(专利权)人:北京时代焦点国际教育咨询有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1