一种英语选择题答案预测方法、装置、设备及存储介质制造方法及图纸

技术编号:34120298 阅读:11 留言:0更新日期:2022-07-14 12:51
本发明专利技术公开了一种英语选择题答案预测方法、装置、设备及存储介质。在获取到英语选择题的题干和多个选项后,将各选项分别代入题干中,得到多个待处理语句,判断待处理语句是否包含对话,基于待处理语句是否包含对话,执行不同的选项预测策略,从多个选项中确定目标选项作为英语选择题的答案。通过将英语选择题划分为对话类和非对话类,针对对话类和非对话类选择题执行不同的选项预测策略,从多个选项中确定目标选项作为英语选择题的答案,用类人解题的方式,直接预测出英语选择题的答案,无需依赖庞大的习题库,不但节省了数据存储空间,还能够解决习题库覆盖面不够导致无法得到正确答案的问题,提高了答案预测准确度。提高了答案预测准确度。提高了答案预测准确度。

【技术实现步骤摘要】
一种英语选择题答案预测方法、装置、设备及存储介质


[0001]本专利技术实施例涉及自然语言处理
,尤其涉及一种英语选择题答案预测方法、装置、设备及存储介质。

技术介绍

[0002]近年来,在线教育的蓬勃发展,出现了越来越多的在线题库网站、APP等。其中,拍照搜题功能是学生们使用频次非常高、也非常受欢迎的功能之一。学生可以通过拍照搜题,拍下自己不会的习题,从而在APP中查看具体的答案和解析,帮助他们理解对应的习题和知识点。然而,这种拍照搜题场景,除了依赖算法本身的准确度以外,还依赖一个非常庞大的习题库。若学生拍的习题在习题库中没有,即使算法再怎么精确,也无法返回令学生满意的答案。然而,无论这个习题库再怎么庞大,也不可能覆盖世界上所有的习题,总有一些检索不到的习题,对于这种场景,目前普遍都很难处理。
[0003]而在众多学科中,英语习题依赖习题库的问题格外突出,其主要原因是英语的很多习题都是来源生活中的一些报刊、杂志等,甚至老师还可以自己造句。而对于一些语法类选择题,只需要随机挖几个空,就可以产生不同的习题。尤其是对于同一个句子,挖的空不同,考察的知识点就不同,也对应了不同的习题。因此,英语的新题产生速度要远远高于其他学科,因此,在拍照搜题的场景下,英语也是最经常出现不能匹配到令人满意的结果的学科。

技术实现思路

[0004]本专利技术提供一种英语选择题答案预测方法、装置、设备及存储介质,无需依赖庞大的习题库,不但节省了数据存储空间,还能提高答案预测准确度。
[0005]第一方面,本专利技术实施例提供了一种英语选择题答案预测方法,包括:
[0006]获取英语选择题的题干和多个选项;
[0007]将各所述选项分别代入所述题干中,得到多个待处理语句;
[0008]判断所述待处理语句是否包含对话;
[0009]基于所述待处理语句是否包含对话,执行不同的选项预测策略,从多个所述选项中确定目标选项作为所述英语选择题的答案。
[0010]可选的,判断所述待处理语句是否包含对话,包括:
[0011]将各所述待处理语句分别输入预置的对话判断模型中进行处理,判断所述待处理语句是否包含对话。
[0012]可选的,将各所述待处理语句分别输入预置的对话判断模型中进行处理,判断所述待处理语句是否包含对话,包括:
[0013]对所述待处理语句中的字符进行词嵌入处理,得到所述待处理语句的表征向量;
[0014]从所述表征向量中提取出用于表征所述待处理语句是否包含对话的第一特征向量;
[0015]将所述第一特征向量映射为所述待处理语句包含对话的概率值;
[0016]基于所述概率值判断所述待处理语句是否包含对话。
[0017]可选的,基于所述待处理语句是否包含对话,执行不同的选项预测策略,从多个所述选项中确定目标选项,包括:
[0018]在所述待处理语句包含对话时,计算所述待处理语句中上句和下句的文本匹配度;
[0019]基于各所述待处理语句对应的所述文本匹配度确定目标选项。
[0020]可选的,计算所述待处理语句中上句和下句的文本匹配度,包括:
[0021]将所述待处理语句输入Roberta模型的输入层进行嵌入处理,得到嵌入矩阵;
[0022]将所述嵌入矩阵输入Roberta模型的编码层中进行处理,得到编码矩阵;
[0023]对所述编码矩阵进行线性变换,得到第二特征向量;
[0024]将所述第二特征向量映射为所述待处理语句中上句和下句的文本匹配度。
[0025]可选的,所述Roberta模型的输入层包括词嵌入层、位置嵌入层和分段嵌入层,将所述待处理语句输入Roberta模型的输入层进行嵌入处理,得到嵌入矩阵,包括:
[0026]在所述词嵌入层对所述待处理语句的字符进行词嵌入操作,得到词嵌入矩阵;
[0027]在所述位置嵌入层对所述待处理语句的字符进行位置嵌入操作,得到位置嵌入矩阵;
[0028]在所述分段嵌入层对所述待处理语句进行分段嵌入操作,得到分段嵌入矩阵;
[0029]将所述词嵌入矩阵、所述位置嵌入矩阵和所述分段嵌入矩阵进行加和,得到嵌入矩阵。
[0030]可选的,所述Roberta模型的编码层包括依次堆叠的M层多头注意力层,所述多头注意力层具有输入矩阵和输出矩阵,M为大于或等于2的正整数,将所述嵌入矩阵输入Roberta模型的编码层中进行处理,得到编码矩阵,包括:
[0031]将所述嵌入矩阵作为第一层多头注意力层的输入矩阵输入第一层多头注意力层中进行处理;
[0032]将前一层多头注意力层的输出矩阵作为后一层多头注意力层的输入矩阵,直至得到最后一层多头注意力层的输出矩阵作为编码矩阵。
[0033]可选的,每一所述多头注意力层的处理过程包括:
[0034]基于多头注意力机制对所述多头注意力层的输入矩阵进行处理,得到注意力矩阵;
[0035]将所述注意力矩阵与所述多头注意力层的输入矩阵进行加和,得到融合矩阵;
[0036]将所述融合矩阵输入全连接前馈层中进行处理,得到全连接矩阵;
[0037]将所述全连接矩阵与所述融合矩阵进行加和,得到所述多头注意力层的输出矩阵。
[0038]可选的,基于所述待处理语句是否包含对话,执行不同的选项预测策略,从多个所述选项中确定目标选项,包括:
[0039]在所述待处理语句不包含对话时,将所述待处理语句输入预置的语法纠错模型中进行处理,得到纠错后的目标语句;
[0040]将与纠错后的所述目标语句相同的所述待处理语句对应的选项作为中间选项;
[0041]当所述中间选项的数量为1时,将所述中间选项作为目标选项;
[0042]当所述中间选项的数量大于1时,计算所述中间选项对应的所述待处理语句的困惑度;
[0043]将所述困惑度最小的所述待处理语句对应的中间选项作为目标选项。
[0044]可选的,计算所述中间选项对应的所述待处理语句的困惑度,包括:
[0045]将各所述中间选项对应的待处理语句分别输入预置的困惑度计算模型中进行处理,得到待生成的语句中各字符在上下文语义环境下的概率分布;
[0046]基于所述概率分布计算所述待处理语句的困惑度。
[0047]可选的,基于所述概率分布计算所述待处理语句的困惑度,包括:
[0048]计算所述概率分布中所有概率值的积得到第一数值;
[0049]计算所述第一数值的倒数得到第二数值;
[0050]计算所述第二数值的N次方根作为所述困惑度,其中,N为所述待处理语句中字符的数量。
[0051]第二方面,本专利技术实施例还提供了一种英语选择题答案预测装置,包括:
[0052]题目获取模块,用于获取英语选择题的题干和多个选项;
[0053]待处理语句确定模块,用于将各所述选项分别代入所述题干中,得到多个待处理语句;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种英语选择题答案预测方法,其特征在于,包括:获取英语选择题的题干和多个选项;将各所述选项分别代入所述题干中,得到多个待处理语句;判断所述待处理语句是否包含对话;基于所述待处理语句是否包含对话,执行不同的选项预测策略,从多个所述选项中确定目标选项作为所述英语选择题的答案。2.根据权利要求1所述的英语选择题答案预测方法,其特征在于,判断所述待处理语句是否包含对话,包括:将各所述待处理语句分别输入预置的对话判断模型中进行处理,判断所述待处理语句是否包含对话。3.根据权利要求2所述的英语选择题答案预测方法,其特征在于,将各所述待处理语句分别输入预置的对话判断模型中进行处理,判断所述待处理语句是否包含对话,包括:对所述待处理语句中的字符进行词嵌入处理,得到所述待处理语句的表征向量;从所述表征向量中提取出用于表征所述待处理语句是否包含对话的第一特征向量;将所述第一特征向量映射为所述待处理语句包含对话的概率值;基于所述概率值判断所述待处理语句是否包含对话。4.根据权利要求1

3任一所述的英语选择题答案预测方法,其特征在于,基于所述待处理语句是否包含对话,执行不同的选项预测策略,从多个所述选项中确定目标选项,包括:在所述待处理语句包含对话时,计算所述待处理语句中上句和下句的文本匹配度;基于各所述待处理语句对应的所述文本匹配度确定目标选项。5.根据权利要求4所述的英语选择题答案预测方法,其特征在于,计算所述待处理语句中上句和下句的文本匹配度,包括:将所述待处理语句输入Roberta模型的输入层进行嵌入处理,得到嵌入矩阵;将所述嵌入矩阵输入Roberta模型的编码层中进行处理,得到编码矩阵;对所述编码矩阵进行线性变换,得到第二特征向量;将所述第二特征向量映射为所述待处理语句中上句和下句的文本匹配度。6.根据权利要求5所述的英语选择题答案预测方法,其特征在于,所述Roberta模型的输入层包括词嵌入层、位置嵌入层和分段嵌入层,将所述待处理语句输入Roberta模型的输入层进行嵌入处理,得到嵌入矩阵,包括:在所述词嵌入层对所述待处理语句的字符进行词嵌入操作,得到词嵌入矩阵;在所述位置嵌入层对所述待处理语句的字符进行位置嵌入操作,得到位置嵌入矩阵;在所述分段嵌入层对所述待处理语句进行分段嵌入操作,得到分段嵌入矩阵;将所述词嵌入矩阵、所述位置嵌入矩阵和所述分段嵌入矩阵进行加和,得到嵌入矩阵。7.根据权利要求5所述的英语选择题答案预测方法,其特征在于,所述Roberta模型的编码层包括依次堆叠的M层多头注意力层,所述多头注意力层具有输入矩阵和输出矩阵,M为大于或等于2的正整数,将所述嵌入矩阵输入Roberta模型的编码层中进行处理,得到编码矩阵,包括:将所述嵌入矩阵作为第一层多头注意力层的输入矩阵输入第一层多头注意力层中进行处理;
将前一层多头注意力层...

【专利技术属性】
技术研发人员:林鑫
申请(专利权)人:广州视琨电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1