一种自动生成英语阅读理解教案的方法技术

技术编号:38538782 阅读:15 留言:0更新日期:2023-08-19 17:07
本发明专利技术的方法基于Transformer模型,使用多个Transformer模型中的基本构建块构建一个多层的自注意力神经网络,将阅读理解表示整个段落的向量、阅读理解教案模板的向量、含有题目及其难度水平和知识点的向量和阅读理解技巧向量经过Transformer模型中的基本构建块进行特征提取,产生一个新的表示答案的向量。所有的Transformer基本构建块输出的向量按照英语阅读理解教案的模板的顺序进行组合,形成最终的英语阅读理解教案。在训练中使用损失函数进行模型训练,并进行交叉验证以确保模型的泛化性能。化性能。化性能。

【技术实现步骤摘要】
一种自动生成英语阅读理解教案的方法


[0001]本专利技术涉及一种自动生成英语阅读理解教案的方法,属于人工智能领域,涉及到自然语言处理和文本生成等技术。

技术介绍

[0002]在人工智能领域中,借助自然语言处理技术解决英语阅读理解教案的生成,帮助老师更好的提取阅读理解文本中的信息,其中,生成的英语阅读理解教案包含教学目标、教学内容、教学方法、教学过程、课堂评价等5个部分,老师从生成教案中选取某一模块的内容,或者选取全部模块的内容帮助老师授课。嵌入技术用于将文本数据转换成连续的向量表示,方便模型进行处理。Transformer是一种基于注意力机制的深度学习模型,可以处理输入序列和输出序列之间的关系。Transformer模型中的基本构建块(TransformerBlock),由多头自注意力机制和前馈神经网络组成,使用了注意力机制来替代传统的逐个输入方式,能够并行化处理,从而提高了训练效率,同时还能够处理更长的序列数据,有效地解决了长期依赖问题。自注意力机制可以捕捉序列数据中不同位置之间的依赖关系,前馈神经网络可以对每个位置的特征进行非线性变换,从而提取更丰富的特征表示。利用Transformer自动生成英语阅读理解的结构化文本教案,帮助教师更加高效地进行教学,提高学习成果。

技术实现思路

[0003]本专利技术提供了一种自动生成英语阅读理解教案的方法,其特征在于:先用嵌入技术将阅读理解文本、包含教学目标、教学内容、教学方法、教学过程、课堂评价等5个部分的英语阅读理解教案模板的对应部分、阅读理解技巧以及包含题目、难度水平和知识点的信息转换为特征向量表示,然后将所述的向量经过Transformer进行特征提取和处理,由解码器生成与英语阅读理解教案模板对应部分的内容。
[0004]其特征的具体步骤为:
[0005]S1:在Transformer编码器中,利用分词和嵌入技术将阅读理解文本转换为表示整个段落的向量,该向量用P表示;将英语阅读理解题目、难度水平和知识点信息转换为一个包含题目、难度水平和知识点的向量,该向量用D表示;将阅读理解技巧文本转换为向量,该向量用E表示和转换后的英语阅读理解教案模板对应部分的向量,该向量用T表示。将向量P/D/E/T加入到输入中;
[0006]S2:通过多头自注意力机制对向量P/D/E/T进行特征提取;在多头自注意力机制中,向量P/D/E/T首先被复制成多个副本,然后每个副本都被作为查询、键和值进行处理。这些查询、键和值向量对应于不同的注意力头,分别提取不同的语义信息;
[0007]S3:将S2中通过多头自注意力特征提取后的向量,使用正则化技术随机地将一部分向量元素置为0后与向量P/D/E/T进行加和,得到一个新的向量。然后将这个新的向量进行残差连接和层归一化处理,得到的向量用P'/D'/E'/T'表示;
[0008]S4:通过前馈神经网络对S3得到的向量P'/D'/E'/T'进行特征提取,把特征提取后得到的向量使用正则化技术随机对部分向量元素置为0,然后与向量P'/D'/E'/T'加和之后进行残差连接和层归一化处理得到一个新的向量,用P”/D”/E”/T”表示;
[0009]S5:将S4得到向量P”、D”、E”、T”进行拼接,得到新的向量,用C表示;
[0010]S6:经过全连接层使用激活函数将向量C映射到表示答案的向量,用A表示;
[0011]S7:将S6的向量A输入到解码器,由解码器生成与英语阅读理解教案模板对应部分的内容。
附图说明
[0012]构成本专利技术的说明书附图用来提供对本专利技术的进一步理解。在附图中:
[0013]图1是本专利技术提供的一种自动生成英语阅读理解教案的方法的流程图;
[0014]图2是一个Transformer的基本构建块获取英语阅读理解教案的对应部分内容的流程图。
具体实施方式
[0015]下面结合附图对本专利技术的具体实施方式进一步说明。在本专利技术中所使用的部分函数和术语是为了描述具体的流程。
[0016]结合附图1对实现本专利技术的详细说明步骤如下:
[0017]步骤一:获取英语阅读理解文本、英语阅读理解的知识点、习题库、阅读理解的难度水平、阅读理解技巧等的数据。英语阅读理解教案模板包括教学目标、教学内容、教学方法、教学过程、课堂评价等5个部分,在模板中为每个部分设置一个唯一的名称,使用嵌入技术将每个部分的名称位置编码,并将其组合成一个向量序列。
[0018]对阅读理解文本进行分词。输入每个单词向量,计算其在段落中的位置,并给出相应的权重。这里使用位置编码技术,为每个单词向量添加位置信息。使用一个全连接层学习单词向量的权重,将其与其对应的权重相乘得到加权单词向量,并给出相应的权重,对所有加权单词向量进行加和,得到一个表示整个段落的向量。对于知识点、难度水平、习题库数据,将习题库的题目进行向量化表示,并将每个题目与对应的难度水平和知识点进行对应,得到一个包含题目、难度水平和知识点的向量表示。同时,使用注意力机制给每个题目赋予不同的权重,以便模型能够更加关注重要的题目。对于阅读理解技巧数据直接使用嵌入技术将其转化为向量。本专利技术中使用位置编码技术,为每个向量添加位置信息。
[0019]位置编码是用来将输入的位置信息融入到向量中,以帮助Transformer网络有效地处理序列数据。每个位置编码的计算基于位置的正弦和余弦函数,表示为:
[0020]这里其中,表示位置上第i个维度的奇数项和偶数项位置编码,t是这个词在整句话中的位置,i是每个词的嵌入向量中的第i个元素,k是双数则用sin,k是单数则用cos。d
model
是词嵌入的维度。
[0021]步骤二:使用多个Transformer模型中的基本构建块(Transformer Block)构建一
个多层的自注意力神经网络,在每个构建块中,输入表示整个段落的向量和英语阅读理解教案模板对应部分的向量以及含有题目及其难度水平和知识点的向量、阅读理解技巧的向量。结合说明书附图的图2的流程图具体解释说明如下:
[0022]S1:利用分词和嵌入技术将阅读理解文本转换为表示整个段落的向量,该向量用P表示。同时,使用嵌入技术将英语阅读理解题目、难度水平和知识点信息转换为一个包含题目、难度水平和知识点的向量,该向量用D表示,并将使用相同嵌入技术转换的阅读理解技巧向量,该向量用E表示和英语阅读理解教案模板对应部分向量,该向量用T表示,将向量P/D/E/T加入到输入中;
[0023]S2:通过多头自注意力机制对向量P/D/E/T进行特征提取;在多头自注意力机制中,向量P/D/E/T首先被复制成多个副本,然后每个副本都被作为查询、键和值进行处理。这些查询、键和值向量对应于不同的注意力头,分别提取不同的语义信息;接下来,通过计算查询向量与键向量之间的相似度得到一个注意力权重矩阵,该矩阵用于加权求和值向量,以获取包含了所有副本信息的新的特征表示。整个过程的公式表示:
[0024本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动生成英语阅读理解教案的方法,其特征在于:先用嵌入技术将阅读理解文本、包含教学目标、教学内容、教学方法、教学过程、课堂评价等5个部分的英语阅读理解教案模板的对应部分、阅读理解技巧以及包含题目、难度水平和知识点的信息转换为特征向量表示,然后将所述的向量经过Transformer进行特征提取和处理,由解码器生成与英语阅读理解教案模板对应部分的内容。2.根据权利要求1所述的特征,其具体步骤为:S1:在Transformer编码器中,利用分词和嵌入技术将阅读理解文本转换为表示整个段落的向量,该向量用P表示;将英语阅读理解题目、难度水平和知识点信息转换为一个包含题目、难度水平和知识点的向量,该向量用D表示;将阅读理解技巧文本转换为向量,该向量用E表示和转换后的英语阅读理解教案模板对应部分的向量,该向量用T表示。将向量P/D/E/T加入到输入中;S2:通过多头自注意力机制对向量P/D/E/T进行特征提取;在多头自注意力机制中,向量P/D/E/...

【专利技术属性】
技术研发人员:戴翰波代锐
申请(专利权)人:武汉慧人信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1