答案获取方法及其装置制造方法及图纸

技术编号:36921000 阅读:23 留言:0更新日期:2023-03-22 18:44
本发明专利技术提出了一种答案获取方法及其装置,涉及数据处理技术领域,该方法包括:获取完型填空类选择题和选择题的候选答案;针对每个候选答案,根据候选答案对选择题的题干进行完型填充,生成候选答案项对应的重构题干;将各候选答案对应的重构题干进行组合,构建选择题对应的模型输入信息;将模型输入信息输入目标语言模型中进行答案预测,以输出选择题的目标答案。通过将题干和候选答案重组打分的方式预测完型填空类选择题的目标答案,实现了自动解答完型填空类选择题的目的,同时通过打分的方法解决了传统相似性匹配精度不高的问题。解决了传统相似性匹配精度不高的问题。解决了传统相似性匹配精度不高的问题。

【技术实现步骤摘要】
答案获取方法及其装置


[0001]本申请涉及数据处理
,尤其涉及一种答案获取方法及其装置。

技术介绍

[0002]随着机器学习和人工智能技术的发展,机器在众多自然语言处理任务上取得了优秀的表现。尤其是在教育领域,机器完型填空任务受到国内外自然语言处理研究领域学者的广泛关注,已成为评价基于自然语言理解的智能系统的核心任务之一。

技术实现思路

[0003]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0004]为此,本申请的一个目的在于提出一种答案获取方法。
[0005]本申请的第二个目的在于提出一种答案获取装置。
[0006]本申请的第三个目的在于提出一种电子设备。
[0007]本申请的第四个目的在于提出一种非瞬时计算机可读存储介质。
[0008]本申请的第五个目的在于提出一种计算机程序产品。
[0009]为达上述目的,本申请第一方面实施方式提出了一种答案获取方法,包括:获取完型填空类选择题和所述选择题的候选答案;针对每个所述候选答案,根据所述候选答案对所述选择题的题干进行完型填充,生成所述候选答案项对应的重构题干;将各所述候选答案对应的重构题干进行组合,构建所述选择题对应的模型输入信息;将所述模型输入信息输入目标语言模型中进行答案预测,以输出所述选择题的目标答案。
[0010]本申请通过将题干和候选答案重组打分的方式,预测选择题的目标答案,实现了自动解答完型填空类选择题的目的,同时通过打分的方法解决了传统相似性匹配精度不高的问题。
[0011]根据本申请的一个实施方式,所述根据所述候选答案对所述选择题的题干进行填充,生成候选答案对应的重构题干之前,还包括:获取所述候选答案的总数量;若所述候选答案的总数量小于所述目标语言模型的答案约束数量,生成补充答案以对所述候选答案进行补充。
[0012]根据本申请的一个实施方式,所述生成补充答案以对所述候选答案进行补充,还包括:基于目标字符生成补充答案,并基于所述补充答案,对所述候选答案进行补充。
[0013]根据本申请的一个实施方式,所述根据所述候选答案对所述选择题的题干进行填充,生成所述候选答案对应的重构题干,还包括:从所述题干中定位出填空位置;将所述候选答案填充至所述填空位置,以生成所述候选答案对应的重构题干。
[0014]根据本申请的一个实施方式,所述将所述候选答案填充至所述填空位置,以生成所述候选答案对应的重构题干,包括:将所述候选答案填充至所述填空位置,得到中间重构题干;将所述候选答案作为标记信息,与所述中间重构题干进行拼接,生成所述候选答案对应的重构题干,其中所述标记信息和所述中间重构题干之间设置有分隔符。
[0015]根据本申请的一个实施方式,所述从所述题干中定位出填空位置,包括:对所述题干进行切词,并获取相邻单词之间的词间距;从所有词间距中识别大于或者等于设定间隔的目标词间距,并确定所述目标词间距对应的目标相邻单词的位置信息;基于所述目标相邻单词的位置信息,确定所述填空位置。
[0016]根据本申请的一个实施方式,所述将所述模型输入信息输入所述目标语言模型中进行识别,以输出所述选择题的目标答案项,包括:将所述模型输入信息输入所述目标语言模型中,由所述语言模型中的自注意力层编码出所述模型输入信息中每个所述重构题干对应的编码向量;将每个所述重构题干对应的编码向量通过全连接层进行预测,以输出每个所述重构题干对应的预测概率,其中,所述预测概率用于表示所述候选答案为所述题干的正确答案的概率;对所述候选答案对应的所述预测概率进行排序,将最大识别概率对应的所述候选答案作为所述目标答案。
[0017]根据本申请的一个实施方式,所述目标语言模型的训练过程包括:采集完型填空类样本选择题、所述样本选择题的样本候选答案和所述样本候选答案的标签信息;针对每个所述样本候选答案,根据所述样本候选答案对所述样本选择题的题干进行完型填充,生成所述样本候选答案项对应的样本重构题干;将各所述样本候选答案对应的样本重构题干进行组合,构建所述样本选择题对应的模型样本输入信息;将所述模型样本输入信息输入构建的语言模型中进行训练,以生成所述目标语言模型。
[0018]为达上述目的,本申请第二方面实施例提出了一种答案获取装置,包括:获取模块,用于获取完型填空类选择题和所述选择题的候选答案;填充模块,用于针对每个所述候选答案,根据所述候选答案对所述选择题的题干进行完型填充,生成所述候选答案项对应的重构题干;组合模块,用于将各所述候选答案对应的重构题干进行组合,构建所述选择题对应的模型输入信息;预测模块,用于将所述模型输入信息输入目标语言模型中进行答案预测,以输出所述选择题的目标答案。
[0019]根据本申请的一个实施方式,所述填充模块,还用于:获取所述候选答案的总数量;若所述候选答案的总数量小于所述目标语言模型的答案约束数量,生成补充答案以对所述候选答案进行补充。
[0020]根据本申请的一个实施方式,所述填充模块,还用于:基于目标字符生成补充答案,并基于所述补充答案,对所述候选答案进行补充。
[0021]根据本申请的一个实施方式,所述填充模块,还用于:从所述题干中定位出填空位置;将所述候选答案填充至所述填空位置,以生成所述候选答案对应的重构题干。
[0022]根据本申请的一个实施方式,所述填充模块,还用于:将所述候选答案填充至所述填空位置,得到中间重构题干;将所述候选答案作为标记信息,与所述中间重构题干进行拼接,生成所述候选答案对应的重构题干,其中所述标记信息和所述中间重构题干之间设置有分隔符。
[0023]根据本申请的一个实施方式,所述填充模块,还用于:对所述题干进行切词,并获取相邻单词之间的词间距;从所有词间距中识别大于或者等于设定间隔的目标词间距,并确定所述目标词间距对应的目标相邻单词的位置信息;基于所述目标相邻单词的位置信息,确定所述填空位置。
[0024]根据本申请的一个实施方式,所述答案获取装置,还用于:将所述模型输入信息输
入所述目标语言模型中,由所述语言模型中的自注意力层编码出所述模型输入信息中每个所述重构题干对应的编码向量;将每个所述重构题干对应的编码向量通过全连接层进行预测,以输出每个所述重构题干对应的预测概率,其中,所述预测概率用于表示所述候选答案为所述题干的正确答案的概率;对所述候选答案对应的所述预测概率进行排序,将最大识别概率对应的所述候选答案作为所述目标答案。
[0025]根据本申请的一个实施方式,所述答案获取装置,还用于:采集完型填空类样本选择题、所述样本选择题的样本候选答案和所述样本候选答案的标签信息;针对每个所述样本候选答案,根据所述样本候选答案对所述样本选择题的题干进行完型填充,生成所述样本候选答案项对应的样本重构题干;将各所述样本候选答案对应的样本重构题干进行组合,构建所述样本选择题对应的模型样本输入信息;将所述模型样本输入信息输入构建的语言模型中进行训练,以生成所述目标语言模型。
...

【技术保护点】

【技术特征摘要】
1.一种答案获取方法,其特征在于,包括:获取完型填空类选择题和所述选择题的候选答案;针对每个所述候选答案,根据所述候选答案对所述选择题的题干进行完型填充,生成所述候选答案项对应的重构题干;将各所述候选答案对应的重构题干进行组合,构建所述选择题对应的模型输入信息;将所述模型输入信息输入目标语言模型中进行答案预测,以输出所述选择题的目标答案。2.根据权利要求1所述的方法,其特征在于,所述根据所述候选答案对所述选择题的题干进行填充,生成候选答案对应的重构题干之前,还包括:获取所述候选答案的总数量;若所述候选答案的总数量小于所述目标语言模型的答案约束数量,生成补充答案以对所述候选答案进行补充。3.根据权利要求2所述的方法,其特征在于,所述生成补充答案以对所述候选答案进行补充,包括:基于目标字符生成补充答案,并基于所述补充答案,对所述候选答案进行补充。4.根据权利要求1所述的方法,其特征在于,所述根据所述候选答案对所述选择题的题干进行填充,生成所述候选答案对应的重构题干,包括:从所述题干中定位出填空位置;将所述候选答案填充至所述填空位置,以生成所述候选答案对应的重构题干。5.根据权利要求4所述的方法,其特征在于,所述将所述候选答案填充至所述填空位置,以生成所述候选答案对应的重构题干,包括:将所述候选答案填充至所述填空位置,得到中间重构题干;将所述候选答案作为标记信息,与所述中间重构题干进行拼接,生成所述候选答案对应的重构题干,其中所述标记信息和所述中间重构题干之间设置有分隔符。6.根据权利要求4所述的方法,其特征在于,所述从所述题干中定位出填空位置,包括:对所述题干进行切词,并获取相邻单词之间的词间距;从所有词间距中识别大于或者等于设定间隔的目标词间距,并确定所述目标词间距对应的目标相邻单词的位置信息;基于所述目标相邻单词的位置信息,确定所述填空位置。7.根据权利要求1

6所述的方法,其特征在于,所述将所述模型输入信息输入所述目标语言模型中进行识别,以输出所述选择题的目标答案项,包括:将所述模型输入信息输入所述...

【专利技术属性】
技术研发人员:王伟泽赵薇王乐魏琢玉张天宇刘洋柳景明
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1