引入多重文本关系的阅读理解试题难度自动预测方法技术

技术编号:30445932 阅读:21 留言:0更新日期:2021-10-24 18:37
本发明专利技术公开了一种引入多重文本关系的阅读理解试题难度自动预测方法,涉及试题难度自动预测技术领域,包括:建立基于多视角注意力的MACNN模型,包括输入层、编码层、交互层、融合层和预测层,获取输入文本,包括问题文本q

【技术实现步骤摘要】
引入多重文本关系的阅读理解试题难度自动预测方法


[0001]本专利技术涉及试题难度自动预测
,更具体的说是涉及一种引入多重文本关系的阅读理解试题难度自动预测方法。

技术介绍

[0002]试题难度是教育考试和个性化试题推荐的重要指标,试题难度预测指在未进行真实试题测试或未得出试题测试结果之前,仅根据试题的形式、内容等特征信息,预测某试题的难度。以往的方法主要基于专家经验,人力和时间成本、财力资源损耗较高。近年来,利用神经网络预测试题难度的研究越来越受到重视,然而,这些方法虽然提高了难度预测的效率,但只是将难度预测任务看作一个简单的分类或预测任务,而忽略了输入文本之间的关系对难度预测的影响,比如只关注问题与文档文本之间的关系,而没有考虑阅读理解多项选择题中选项内容之间的混淆关系对难度预测的影响。
[0003]因此,如何提出一种可以减少人力和财力资源消耗,克服传统人工试题难度评估工作的不足,同时考虑输入文本之间关系的试题难度预测模型是本领域技术人员亟需解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种引入多重文本关系的阅读理解试题难度自动预测方法,考虑了输入文本之间的关系,克服了传统人工试题难度评估工作的不足,减少了人力和财力资源消耗。
[0005]为了实现上述目的,本专利技术提供如下技术方案:
[0006]一种引入多重文本关系的阅读理解试题难度自动预测方法,包括以下步骤:
[0007]建立基于多视角注意力的MACNN模型,所述MACNN模型包括输入层、编码层、交互层、融合层和预测层;
[0008]获取输入文本,所述输入文本包括问题文本q
i
、对应文档d
i
及问题的候选选项o
i

[0009]将获取的所述输入文本作为所述MACNN模型的输入送到所述输入层;
[0010]利用所述编码层对所述输入文本进行卷积操作,提取所述输入文本的上下文表示;
[0011]通过所述交互层分别获取问题文本与对应文档、问题文本与候选选项、候选选项与候选选项之间的交互关系信息;
[0012]利用所述融合层将交互层获取的所述交互关系信息进行整合,并通过所述预测层预测试题难度。
[0013]上述的技术方案公开了本专利技术中对阅读理解难度进行自动预测的具体步骤,提出了一种具有多角度注意机制的卷积神经网络MACNN,在阅读理解中从不同输入文本中提取不同交互关系信息,可以达到自动预测试题难度的目的。
[0014]优选的,所述对应文档d
i
以句子序列形式表示为d
i
={s1,s2,...,s
n
,...,s
N
},N表
示句子序列的长度,s
n
表示第n个句子,1≤n≤N;每个句子由有限个单词组成,表示为s
n
={w1,w2,...,w
m
,...,w
M
},M表示句子的长度,w
m
表示第m个单词,1≤m≤M,w
m
∈R
d
通过d维预训练的单词嵌入初始化,其中R
d
表示d维矩阵。
[0015]优选的,利用所述编码层对所述输入文本进行卷积操作,将连续的k个单词组合成一个局部语义表示,获得一个新的隐藏序列为其中,
[0016]其中:h表示得到的新隐藏层向量,σ表示sigmoid函数,w
m

k+1
表示第(m

k+1)个单词,w
m
表示第m个单词,b表示第一参数矩阵;
[0017]G∈R
d1
×
kd
,G表示权重矩阵,d1表示输出编码维度,b∈R
d1
是卷积参数,是将k个向量拼接的操作。
[0018]上述的技术方案中公开了输入文本在输入层和编码层的主要形式,对于给定的问题文本、对应文档和候选选项,使用CNN提取上下文表示,从阅读习惯的角度来看,CNN更适合从局部到整体捕捉每个句子的关键信息。
[0019]优选的,所述交互层包括阅读模块、回忆模块和混淆模块;
[0020]利用所述阅读模块通过注意力评估所述问题文本和对应文档之间的语义相关性:其中,注意力权重其中,注意力权重是文档D中的第j个句子,是问题文本q
i
的句子向量表示,d是维度,L
D
表示文档最大长度;
[0021]利用所述回忆模块提取所述问题文本和候选选项之间的交互关系信息,得到问题相关文档语义表示为:其中,注意力权重L
o
表示选项最大长度,是第j个选项文本的向量表示;通过所述混淆模块获取所述候选选项与候选选项之间的混淆信息为:其中,注意力权重S
A
是正确答案。
[0022]上述的技术方案将教育理论证明的影响难度预测的关键因素:阅读、回忆、困惑等相关信息融入模型,通过交互层设计的三个模块采用不同的注意力机制,分别从问题文本、对应文档和候选选项两两之间提取不同的交互关系信息。
[0023]优选的,利用所述融合层通过拼接方式将交互层获取的所述交互关系信息进行整合,利用全连接层的输出p0预测试题难度
[0024][0025]其中:W1表示第二参数矩阵,b1表示第三参数矩阵;
[0026]利用logistic函数计算为:
[0027][0028]其中:W2表示第四参数矩阵,b2表示第五参数矩阵;
[0029]将训练损失定义为最小方差损失的总和:
[0030][0031]其中:P
i
是真实难度标签,N(Q)代表问题总数,θ
M
表示模型中所有的参数,γ是权重超参数。
[0032]上述的技术方案公开了通过设置的融合层和预测层对不同的交互关系信息进行整合并最终预测试题难度的计算过程,可以达到自动预测阅读理解试题难度的目的。
[0033]经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种引入多重文本关系的阅读理解试题难度自动预测方法,具有以下有益技术效果:
[0034](1)本专利技术建立的阅读理解试题难度预测模型,能够辅助或替代传统人工试题难度评估工作,进而减少人力和财力资源的消耗;
[0035](2)本专利技术中将教育理论证明的影响难度预测的关键因素(阅读、回忆、困惑等相关信息)融入模型,建立的MACNN模型的性能更好,提高了预测结果的准确性;
[0036](3)本专利技术可以用于自适应学习系统中习题难度迭代更新,为题库中难度自动化标注提高效率,便于管理者使用;有利于在线教育资源的有效管理、精确检索和精准个性化推荐,自动化难度预测可以为练习题自动分配难度值,为不同知识水平学生个性化推荐不同难度的练习题,提升在线学习效率以及练习效果。
附图说明
[0037]为了更清楚地说明本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种引入多重文本关系的阅读理解试题难度自动预测方法,其特征在于,包括以下步骤:建立基于多视角注意力的MACNN模型,所述MACNN模型包括输入层、编码层、交互层、融合层和预测层;获取输入文本,所述输入文本包括问题文本q
i
、对应文档d
i
及问题的候选选项o
i
;将获取的所述输入文本作为所述MACNN模型的输入送到所述输入层;利用所述编码层对所述输入文本进行卷积操作,提取所述输入文本的上下文表示;通过所述交互层分别获取问题文本与对应文档、问题文本与候选选项、候选选项与候选选项之间的交互关系信息;利用所述融合层将交互层获取的所述交互关系信息进行整合,并通过所述预测层预测试题难度。2.根据权利要求1所述的一种引入多重文本关系的阅读理解试题难度自动预测方法,其特征在于,所述对应文档d
i
以句子序列形式表示为d
i
={s1,s2,...,s
n
,...,s
N
},N表示句子序列的长度,s
n
表示第n个句子,1≤n≤N;每个句子由有限个单词组成,其中s
n
={w1,w2,...,w
m
,...,w
M
},M表示句子的长度,w
m
表示第m个单词,1≤m≤M,w
m
∈R
d
通过d维预训练的单词嵌入初始化,其中R
d
表示d维矩阵。3.根据权利要求1所述的一种引入多重文本关系的阅读理解试题难度自动预测方法,其特征在于,利用所述编码层对所述输入文本进行卷积操作,将连续的k个单词组合成一个局部语义表示,获得一个新的隐藏序列为其中,其中:h表示得到的新...

【专利技术属性】
技术研发人员:何珺张迎辉孙波余乐军彭丽
申请(专利权)人:北京师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1