完型填空答题方法、装置、电子设备及存储介质制造方法及图纸

技术编号:22076147 阅读:34 留言:0更新日期:2019-09-12 14:16
本发明专利技术涉及一种完型填空答题方法、装置、电子设备及存储介质。所述方法包括:构建题目文档数据中的单词的词向量;对所述题目文档数据中的单词的词向量进行双向长短记忆网络编码后生成单词的单词向量;构建问题数据中单词的词向量,并对所述问题数据中的单词的词向量进行编码后生成问题向量;将题目文档数据中的每个单词的单词向量与所述问题数据中的问题向量作点积并归一化得到所述题目文档数据中的每个单词的概率值,并将所述题目文档数据中相同单词的概率进行合并得到所述题目文档数据中所有单词的概率;及根据判断结果及所述答案数据确定最终答案。

Cloze Answering Method, Device, Electronic Equipment and Storage Media

【技术实现步骤摘要】
完型填空答题方法、装置、电子设备及存储介质
本专利技术涉及计算机处理领域,具体涉及一种完型填空答题方法、装置、电子设备及存储介质。
技术介绍
完形填空题是我国各地中学英语试题中最为流行的一种题型,也是难度大,得分率低的题型。一般来说,完形填空阅读理解是一种文档与查询之间挖掘关系的代表性问题,完形填空题的干扰项的设置主要与文意相关。现有的自动完形填空系统是基于n元模型构建的朴素系统,主要依据词组在文档中出现的频次来判断,只能回答文档中已经出现过的单词组合,但缺乏推理能力,对于文中没有出现的固定搭配,则无法给出答案。
技术实现思路
鉴于以上内容,有必要提出一种完型填空答题方法、装置、电子设备及计算机可读存储介质,以解决完型填空问题与完型填空答案的组合在文中没有出现固定搭配的情况下无法自动给出答案的问题。本申请的第一方面提供一种完型填空答题方法,其特征在于,所述方法包括:获取答题数据,其中,所述答题数据包括题目文档数据、问题数据及答案数据;构建所述题目文档数据中的单词的词向量;对所述题目文档数据中的单词的词向量进行双向长短记忆网络编码后生成所述题目文档数据中的单词的单词向量;构建所述问题数据中本文档来自技高网...

【技术保护点】
1.一种完型填空答题方法,其特征在于,所述方法包括:获取答题数据,其中,所述答题数据包括题目文档数据、问题数据及答案数据;构建所述题目文档数据中的单词的词向量;对所述题目文档数据中的单词的词向量进行双向长短记忆网络编码后生成所述题目文档数据中的单词的单词向量;构建所述问题数据中单词的词向量,并对所述问题数据中的单词的词向量进行双向长短记忆网络编码并将经过编码的词向量通过所述双向长短记忆网络的输出层输出后生成问题向量;将所述题目文档数据中的每个单词的单词向量与所述问题数据中的问题向量作点积并归一化得到所述题目文档数据中的每个单词的概率值,并将所述题目文档数据中相同单词的概率进行合并得到所述题目文...

【技术特征摘要】
1.一种完型填空答题方法,其特征在于,所述方法包括:获取答题数据,其中,所述答题数据包括题目文档数据、问题数据及答案数据;构建所述题目文档数据中的单词的词向量;对所述题目文档数据中的单词的词向量进行双向长短记忆网络编码后生成所述题目文档数据中的单词的单词向量;构建所述问题数据中单词的词向量,并对所述问题数据中的单词的词向量进行双向长短记忆网络编码并将经过编码的词向量通过所述双向长短记忆网络的输出层输出后生成问题向量;将所述题目文档数据中的每个单词的单词向量与所述问题数据中的问题向量作点积并归一化得到所述题目文档数据中的每个单词的概率值,并将所述题目文档数据中相同单词的概率进行合并得到所述题目文档数据中所有单词的概率;判断所述题目文档数据中概率最大的单词与所述答案数据中的单词是否相同;及根据判断结果及所述答案数据确定最终答案。2.如权利要求1所述的完型填空答题方法,其特征在于,所述根据判断结果及所述答案数据确定最终答案包括:当所述题目文档数据中概率最大的单词与所述答案数据中的单词向量相同时,将在所述答案数据中与概率最大的单词相同的单词确认为最终答案。3.如权利要求1所述的完型填空答题方法,其特征在于,所述构建所述题目文档数据中的单词的词向量包括:对所述答题数据中的每个单词分别进行独热编码生成单词的编码向量;构建所述答题数据中所有单词的词嵌入矩阵;及将所述题目文档数据中的单词的编码向量与所述词嵌入矩阵进行乘积运算并降维后得到所述题目文档数据中单词的词向量。4.如权利要求3所述的完型填空答题方法,其特征在于,所述对所述答题数据中的每个单词分别进行独热编码生成单词的编码向量包括:根据所述答题数据中的所有的单词数量确定所述答题数据中的单词的编码向量的维度,并根据单词在所述答题数据中的排序位置确定所述单词的编码向量的目标维度的位置,将所述编码向量在所述目标维度位置处设置为1,及将所述编码向量中除所述目标维度位置以外的维度位置设置为0。5.如权利要求3所述的完型填空答题方法,其特征在于,所述对所述题目文档数据中的单词的词向量进行双向长短记忆网络编码后生成所述题目文档数据中的单词的单词向量包括:对所述题目文档数据中的单词的词向量建立第一双向长短记忆网络并训练所述第一双向长短记忆网络,根据公式利用已训练的所述第一双向长短记忆网络对所述题目文档数据中的单词的词向量进行编码,其中,e(x)为所述题目文档数据中单词的词向量,s为所述第一双向长短记忆网络中当前隐藏层在所述第一双向长...

【专利技术属性】
技术研发人员:吴良顺
申请(专利权)人:卓尔智联武汉研究院有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1